2016-1-13
Após um ano de publicação, 80 por cento das páginas online desaparecem ou são alteradas. O serviço de preservação digital prestado pelo Arquivo.pt, uma iniciativa da FCT, existe para conservar esse histórico e contribuir para que informação valiosa não se perca.
Sempre que desejar revisitar informação perdida na web no seu estado original, é possível encontrá-la em http://arquivo.pt. O domínio oferece um serviço de pesquisa público e gratuito sobre dados arquivados da web desde 1996. Preservar a web requer um esforço contínuo e é na recuperação do acesso a estes endereços que o serviço prestado pelo Arquivo da Web Portuguesa (Arquivo.pt) se propõe ser útil, para que o conhecimento nela contido esteja acessível a gerações futuras. Esta foi uma iniciativa da unidade FCCN da FCT, uma infraestrutura de investigação focada na preservação de conteúdos de interesse para a comunidade portuguesa. Pode também servir utilizadores internacionais, uma vez que preserva páginas em várias línguas e oferece a possibilidade de acesso a conteúdos históricos em português a utilizadores estrangeiros, através de ferramentas de tradução automática. A preservação da web é realizada de forma automática e recorre a um sistema informático de larga escala. Diariamente são recolhidas 300 publicações seleccionadas e, a cada três meses, todos os sites sob o domínio .pt são guardados. Após os dados serem recolhidos a informação é processada, de modo a ser pesquisáveis e acessível. São arquivados cerca de 2 7000 milhões de ficheiros (95TB de informação), sendo que qualquer pessoa poderá sugerir endereços para preservação. O Arquivo.pt surgiu entre 2001 e 2006 num projecto, realizado na FCUL, resultando de uma investigação nacional na área da preservação digital No ano passado, o Arquivo.pt para preservação cerca de 580 milhões de ficheiros e o serviço de pesquisa registou, em média, 3 692 utilizadores por mês (90 por cento novos utilizadores). O Arquivo.pt realizou uma primeira tentativa de arquivar sites alojados sob o domínio .eu, um projeto que surgiu no âmbito de atividades do Research Infrastructure for the Study of Archived Web Materials (RESAW), a rede europeia que tem como objetivo a criação de uma infraestrutura dedicada ao estudo de materiais arquivados da web. As Eleições Presidenciais de 2016, têm lugar marcado no arquivo.pt, replicando o esforço já feito nesse sentido para as Eleições Legislativas de 2015, contando com a ajuda de voluntários que ajudaram a identificar 184 sites relacionados com a temática. Para 2016 o Arquivo.pt tem grandes desafios, nomeadamente vir a ser mais conhecido e utilizado pelo público como uma ferramenta útil. Estará em desenvolvimento um protótipo de pesquisa de imagens arquivadas, função requisitada pelos utilizadores, e há ainda planos para potenciar a reprodução de conteúdos arquivados de forma a evitar falta de imagens na visualização das páginas arquivadas. |