quinta-feira, 24 de janeiro de 2013

Análise do DSpace

Resumo: Este texto visa analisar os metadados utilizados para descrever o artigo de teste que se encontra na plataforma Dspace e verificar se eles são adequados para descrever esse objeto do ponto de vista da preservação digital. Ao analisar os metadados utilizados para descrever o artigo de teste na plataforma Dspace, é necessário esclarecer o significado da plataforma, suas ferramentas e a maneira como foi criada. Para tal, buscamos referências como o artigo de Rodrigo Santis e o documento e-Arq Brasil, Modelo de Requisitos para Sistemas Informatizados de Gestão Arquivística de Documentos elaborado pela Câmara Técnica de Documentos Eletrônicos do CONARQ.
Palavras Chaves: DSpace, Metadados, Software, Biblioteca Digital, Documento de Arquivo, Preservação Digital.

A plataforma Dspace é um ambiente de software, sendo uma ferramenta disponível para o gerenciamento e manutenção de bibliotecas digitais, documentos de arquivos e museus. O DSpace é um projeto feito em parceria entre uma das principais instituições de pesquisas tecnológicas, o Massachusetts Institute of Technology (MIT, 2007) e uma das maiores empresas do setor de tecnologia, a Hewlett-Packard (HP, 2007). Um fator importante na escolha da ferramenta é a credibilidade das instituições envolvidas, pois tais instituições referendam e garantem a qualidade e a continuidade do desenvolvimento da ferramenta.
Segundo estatísticas da Registry of Open Access Repositories (ROAR, 2007), o DSpace já é a ferramenta mais utilizada para bibliotecas digitais no mundo, superando inclusive ferramentas mais antigas como o E-Prints (EPrints, 2007). Além disso, o DSpace é a ferramenta que possui a comunidade de colaboradores com o maior número de atividade entre os participantes cadastrados.
Além disso, o DSpace é um software gratuito, e que se apóia em aplicações periféricas também gratuitas (como bancos de dados e servidores web), sem qualquer custo de licenciamento de software. Outra vantagem do DSpace é o fato dele ser adepto da iniciativa de arquivos livres, a Open Archives Iniciative (OAI, 2007).
Metadados são as informações utilizadas para descrever e identificar os recursos digitais (tais como Título, Autor, Data de Criação etc.). O padrão de descrição de metadados suportado pelo protocolo OAI-PHM e com o qual o DSpace é compatível, é o Dublin Core (DCMI, 2007). Este padrão foi proposto em 1995 por um grupo multidisciplinar que contou com a participação de biblioteconomistas, museólogos e profissionais da área de informática. O Dublin Core propõe a utilização de um conjunto de quinze elementos básicos para descrever um recurso digital, aos quais pode-se aplicar qualificadores. O recurso digital deve estar acessível independentemente de configurações de rede, ou de mudanças no nome do servidor, por exemplo. A maneira de garantir isso é a utilização de identificadores persistentes, que, na verdade, são identificadores baseados em endereços únicos (URIs), que servem como meio de referenciar um determinado recurso digital (handle).
No trabalho elaborado pelo CONARQ, o e-Arq Brasil, foi adotada uma concepção baseada na definição do termo metadado conforme estabelecido no Glossário da Câmara Técnica de Documentos Eletrônicos (CTDE) do Conselho Nacional de Arquivos, isto é, “dados estruturados que descrevem e permitem encontrar, gerenciar, compreender e/ou preservar documentos arquivísticos ao longo do tempo”.
O que significa “Evento de preservação”?
Evento de preservação refere-se às ações de preservação realizadas nos documentos arquivísticos digitais, tais como migração (atualização, conversão), compressão, validação de assinatura digital, decifração, verificação de fixidade, cálculo hash, replicação, verificação de vírus e validação. Relaciona-se com o componente digital e com o agente responsável pela ação de preservação.
O que significa cada evento de preservação?
O e-Arq Brasil traz a definição de cada evento e os elementos de metadados que o caracterizam e que devem ser registrados. É importante notar que esta listagem mostra os eventos mais importantes de serem registrados. Não se esgotaram as possibilidades; os órgãos e entidades podem incluir outros eventos que julgarem necessários.
1)    Compressão: Registro da compressão ou descompressão de documentos. Registrar informações tais como: identificação da compressão, data da compressão, agente responsável pela compressão e resultado da compressão.
2)    Decifração: Registro da decifração de documentos. Registrar informações tais como: identificação da decifração, data da decifração, agente responsável pela decifração e resultados da decifração.
3)    Validação de assinatura digital: Registro de validação da assinatura digital de um documento de acordo com o certificado digital deste. Registrar informações tais como: identificação da validação, data da validação, agente responsável pela validação e resultados da validação.
4)    Verificação de fixidade: Registro da verificação de fixidade de um documento, ou seja, se os recursos utilizados para garantir a fixidade (assinatura digital, marca d’água, checksum etc.) não foram corrompidos. Registrar informações tais como: tipo de recurso de autenticação, identificação da verificação, data da verificação, agente responsável pela verificação e resultados da verificação.
5)   Cálculo hash: Registro do cálculo hash de criptografia. Registrar informações tais como: identificação do cálculo, data do cálculo, agente responsável pelo cálculo e detalhes do cálculo.
6)    Migração: Registro de procedimento de migração de documento. Registrar informações tais como: identificação da migração, data da migração, agente responsável pela migração, resultado da migração e consequências da migração.
7)    Replicação: Registro de procedimento de replicação de documento. Registrar informações tais como: identificação da replicação, data da replicação, agente responsável pela replicação e consequências da replicação.
8)  Verificação de vírus: Registro de verificação de vírus no documento. Registrar informações tais como: identificação da verificação, data da verificação, agente responsável pela verificação e detalhes da verificação.
9)   Validação: Registro de validação de documento. Registrar informações tais como: identificação da validação, data da validação, agente responsável pela validação e detalhes da validação.
Partindo para a análise dos metadados utilizados para descrever o artigo de teste da plataforma Dspace, observa-se que tais metadados são: o nome do autor, data, identificador e descrição.
De acordo com Luís Fernando Sayão, “a definição dos tipos e dos contornos das informações necessárias para se instruir corretamente os processos de preservação digital foi objeto de grandes discussões num passado recente. Porém, apesar dos inúmeros pontos de tensões, os debates foram capazes de estabelecer um consenso em torno de cinco grandes categorias de informação. Essas categorias são materializadas por uma descrição aprofundada e ampla dos aspectos técnicos, custodiais e legais dos recursos digitais que devem ser traduzidos por metadados de preservação. Resumidamente, são as seguintes:
1)     proveniência – os metadados de preservação devem registrar informações sobre a história do objeto desde sua origem, traçando a sua cadeia de custódia e de propriedade;
2)     autenticidade – os metadados de preservação devem incluir informações suficientes para validar que o objeto é de fato o que diz ser e que não sofreu alterações – intencionais ou não - não documentadas;
3)   atividades de preservação – os metadados de preservação devem documentar as ações tomadas ao longo do tempo para preservar o objeto digital e as consequências dessas ações sobre aparência, usabilidade e funcionalidades do objeto;
4) ambiente técnico – os metadados de preservação devem descrever as dependências técnicas necessárias para a apresentação e uso dos objetos digitais, tais como hardware, sistema operacional e software de aplicação;
5)   gestão de direitos – os metadados de preservação devem registrar todos os itens relacionados às questões de propriedade intelectual que limitem as ações de preservação, de disseminação e uso por parte de usuários de hoje e do futuro (LAVOIE; GARTNER, 2005)” (SAYÃO, 2010)
Tomando por base as leituras realizadas e as informações disponibilizadas pelos autores estudados, pode-se verificar que os metadados encontrados no artigo de teste são insuficientes para descrever este objeto do ponto de vista da preservação. Primeiramente, não trazem consigo as informações do objeto desde sua origem, nem a cadeia de custódia e de propriedade. Além disso, não há registro a respeito da validação de que o objeto realmente é o que diz ser e que o mesmo não sofreu alterações. Seguindo, estes metadados não trazem consigo a documentação das ações tomadas ao longo do tempo para preservar o objeto digital, nem mesmo a descrição das dependências técnicas necessárias para a apresentação e uso de objetos digitais, como hardware e software. Por último, os metadados de preservação devem registrar todos os itens relacionados às questões de propriedade intelectual, o que não ocorre no artigo de teste.
Referências:
Conselho Nacional de Arquivos (Brasil). Câmara Técnica de Documentos Eletrônicos. e-ARQ Brasil: Modelo de Requisitos para Sistemas Informatizados de Gestão Arquivística de Documentos / Câmara Técnica de Documentos Eletrônicos. 1.1. versão. - Rio de Janeiro : Arquivo Nacional, 2011. Disponível em: <http://www.documentoseletronicos.arquivonacional.gov.br/media/e-arq-brasil-2011-corrigido.pdf>Acesso em 24/01/2013
RONDINELLI, R.C., Gerenciamento arquivístico de documentos eletrônicos, Rio de Janeiro, Editora FGV, 2002.
SANTIS, Rodrigo. DSPACE PARA A IMPLANTAÇÃO DE BIBLIOTECAS DIGITAIS – APLICAÇÃO A UMA COLEÇÃO DE RECURSOS MUSICAIS (pdf). Disponível em: <www.bibliotecadigital.unicamp.br/document/?down=23481>Acesso em 24/01/2013
SANTOS, Vanderlei Batista dos; INNARELLI, Humberto Celeste; SOUSA, Renato Tarciso Barbosa de. Arquivística: temas contemporâneos: classificação, preservação digital e gestão do conhecimento; 3ª ed: Distrito Federal: SENAC, 2009.
SAYÃO, Luís Fernando. UMA OUTRA FACE DOS METADADOS: INFORMAÇÕES PARA A GESTÃO DA PRESERVAÇÃO DIGITAL, 2010. Disponível em: <http://www.periodicos.ufsc.br/index.php/eb/article/view/12528>Acesso em 24/01/2013

Nenhum comentário:

Postar um comentário