E o dia-a-dia vira história

Coordenadora da Biblioteca do Congresso dos EUA explica aquisição do acervo do Twitter

PUBLICIDADE

Por Tatiana Mello Dias
Atualização:

Login: Abbie Grotke, coordenadora de Mídias Digitais da Biblioteca do Congresso dos EUA

PUBLICIDADE

A Biblioteca do Congresso dos Estados Unidos é a maior do mundo e há dez anos arquiva a internet. Já são 167 terabytes de dados (cada TB equivale a 1.000 gigabytes) – e a eles em breve se juntará todo o acervo do Twitter, adquirido no início do mês. O Link conversou com a responsável pelo Projeto de Mídias Digitais, Abigail Grotke.

É diferente preservar objetos digitais? A preservação de objetos digitais traz novos desafios em relação ao que selecionar. Nós não podemos arquivar toda a web, então a seleção é uma grande preocupação. Também há outras questões legais e copyright. Nos EUA, as instituições precisam dar permissão para arquivar, preservar e tornar o acervo acessível aos pesquisadores. Além disso, ferramentas especiais são necessárias para arquivar o conteúdo da web e esse é um campo relativamente novo.

Quem decide sobre o que será preservado? Muitos países são capazes de definir a preservação de todo o seu domínio – como as bibliotecas nacionais da Suécia, Noruega, Dinamarca, França e outras. Não há uma maneira fácil, porém, para identificar todo o domínio nacional americano. Então adotamos uma abordagem seletiva: preservamos os sites selecionados pelos nossos especialistas que são relacionados a temas ou eventos, como as eleições ou o 11 de setembro. Também arquivamos sites produzidos pelo Congresso e os de interesse para nossa biblioteca legal.

Por que arquivar o todo o acervo de tweets? O Twitter é parte de um registro histórico de comunicação, divulgação de notícias e tendências sociais – todos pertinentes para as coleções de herança cultural É um arquivo direto de importantes eventos como a eleição americana de 2008 e a Revolução no Irã. Isso também serve como um ‘feed de notícias’ e é uma plataforma para o jornalismo cidadão com muitos eventos significantes reportados primeiro pelas testemunhas oculares. Individualmente, os tweets podem soar insiginificantes. Mas, coletivamente, são um recurso para as futuras gerações entenderem a vida no século 21.

Como fica a privacidade dos usuários?

O Twitter tem sido uma plataforma de comunicações pública e aberta desde o seu início. Informações dos usuários e tweets privados não serão inclusos. Tweets apagados não farão parte do arquivo, nem informação anexada como imagens e sites. A doação original conterá toda a informação pública postada desde 2006. Haverá uma janela de seis meses entre a data dos tweets e o dia em que eles estarão disponíveis para pesquisa.

Publicidade

O acervo ficará disponível ao público em geral? A biblioteca está interessada em preservar o acesso ao arquivo a longo prazo. A coleção do Twitter servirá como um caso de estudo útil de como desenvolver políticas para uso de pesquisa de todos os nossos arquivos digitais. A Biblioteca não tentará reproduzir a funcionalidade do Twitter. Estamos interessados em oferecer tweets complementares a algumas coleções digitais da biblioteca.

  • Arquivo da Web Portuguesa

Portugal é um dos países em que toda a internet está sendo arquivada. “É tão importante guardar as publicações que estão na web quanto as impressas”, disse ao Link Daniel Gomes, coordenador do Arquivo da Web Portuguesa. O projeto, capitaneado pela Fundação para a Computação Científica Nacional, já guardou 14 TB de dados em servidores próprios e em computadores de cidadãos comuns que doam pelo menos 100 MB de espaço para o projeto. Não há seleção – tudo que está sob domínio .pt é guardado. A maior dificuldade, porém, não é o espaço: é garantir uma busca eficiente. “As pessoas estão acostumadas ao Google. Temos que dar as respostas em poucos segundos, senão os utilizadores ficam frustrados”.

Comentários

Os comentários são exclusivos para assinantes do Estadão.