Leitura de História

A ameaça da amnésia digital e a luta para preservar a web

Descubra como a fragilidade digital ameaça nossa memória coletiva e o que iniciativas como o Internet Archive estão fazendo para preservá-la.

Na Antiguidade, fragmentos de papiros, mosaicos e tábuas de cera registravam o cotidiano das civilizações. Graças a esses registros, sabemos, por exemplo, o que os moradores de Pompeia comiam no café da manhã há mais de dois mil anos. Do mesmo modo, registros como o Domesday Book nos permitem reconstituir a vida rural na Inglaterra medieval, documentando detalhes desde a posse de terras até a criação de animais. E, avançando para a Era Vitoriana, cartas e romances remanescentes revelam a complexidade das relações sociais e as figuras mais admiradas da época. Contudo, ao olhar para o futuro, a continuidade desse conhecimento está ameaçada: os historiadores do século XXI enfrentam o desafio de preservar registros digitais tão frágeis quanto efêmeros.

A ironia da era digital é que, embora tenhamos um volume inédito de informações, há uma alarmante escassez de esforço para arquivar esse conteúdo. Muito do que produzimos e consumimos diariamente online corre o risco de desaparecer, deixando lacunas para os estudiosos das próximas gerações. Mas um grupo crescente de organizações e voluntários vem tentando combater essa “amnésia digital”. Entre elas, destaca-se o Internet Archive, criado em 1996 por Brewster Kahle, um dos pioneiros da internet. Localizada em São Francisco, a organização é um bastião na luta para preservar a memória digital e oferece um serviço inestimável ao público.

O Internet Archive hospeda uma vasta coleção digital: são 866 bilhões de páginas web, 44 milhões de livros, 10,6 milhões de vídeos e muito mais. Tudo isso distribuído por diversos centros de dados ao redor do mundo. O projeto inclui a famosa Wayback Machine, que armazena cópias de websites, documentando a web como ela evolui. Mesmo com a magnitude desse projeto, ele enfrenta dificuldades financeiras, desafios técnicos e ameaças jurídicas, muitas vezes derivadas de questões de direitos autorais. Grandes editoras e gravadoras, por exemplo, têm contestado legalmente o direito do Internet Archive de oferecer cópias digitais de suas obras. A Wayback Machine permite o acesso a links quebrados, restabelecendo conteúdo que teria sido perdido para sempre. Mark Graham, diretor da Wayback Machine, explica que a web é naturalmente instável. Embora existam incentivos econômicos para colocar conteúdo online, há poucos estímulos para que empresas o mantenham disponível por longo prazo.

Estudos recentes mostram a vulnerabilidade dessa infraestrutura digital. Um levantamento do Pew Research Center revelou que cerca de 25% das páginas da web de 2013 já não existem. Isso representa uma perda significativa, e é um problema que se agrava com o tempo. Em 2023, o estudo indicou que aproximadamente 8% das páginas web publicadas no mesmo ano já estavam fora do ar. Esse desaparecimento impacta até fontes amplamente confiáveis, como a Wikipédia, onde mais da metade dos artigos possui links quebrados em suas referências. Assim, evidências essenciais para manter a precisão e a transparência das informações estão se deteriorando aos poucos.

O desaparecimento de websites não é uma preocupação limitada aos apaixonados pela história ou aos estudiosos da internet. Governos também estão vulneráveis a essa fragilidade digital, com muitos websites oficiais sofrendo com links quebrados. Felizmente, o trabalho do Internet Archive permite que uma parte dessas referências ainda seja acessada, preservando ao menos um retrato parcial da internet.

Outras instituições, como a Biblioteca do Congresso dos Estados Unidos e a Biblioteca Britânica, também têm seus próprios projetos de preservação digital. Nos Estados Unidos, a Biblioteca do Congresso mantém um acervo de websites governamentais e uma coleção de tweets arquivados, documentando registros digitais para pesquisas futuras. O UK Web Archive, por sua vez, realiza uma varredura anual para registrar a internet britânica, assegurando que o patrimônio digital do país esteja disponível para futuras gerações. No entanto, mesmo com todos esses esforços, o volume e a complexidade da internet tornam a preservação total um objetivo inatingível. Essas iniciativas são cruciais, mas, como apontam especialistas, ainda são insuficientes diante da escala do problema.

Há outros esforços notáveis em cenários de crise, como o projeto de voluntários para salvar a internet ucraniana durante ataques cibernéticos em 2022. No entanto, a cobertura desses projetos é limitada. Mesmo o Internet Archive, com seus vastos recursos, enfrenta dificuldades para atender a uma demanda tão abrangente. Ainda assim, para muitos, ele se tornou uma fonte primária de registros históricos da web, funcionando quase como uma “biblioteca mundial” da internet.

Paradoxalmente, o sucesso do Internet Archive em preservar a web também cria uma espécie de complacência, levando outros a delegarem a ele essa responsabilidade. Muitos websites e publicações citam links do Wayback Machine em vez de manterem suas próprias cópias. Em 2023, o CNET foi alvo de críticas após ter apagado milhares de artigos e transferido a responsabilidade de preservação ao Internet Archive. O caso ilustra uma tendência preocupante: quando empresas deixam de preservar seu conteúdo, recorrem ao Internet Archive como último recurso, sem que isso traga qualquer apoio financeiro ao projeto.

A preservação digital não se restringe a enfrentar questões de perda de dados ou links quebrados; ela também enfrenta ameaças técnicas e jurídicas. Em maio de 2024, o Internet Archive foi alvo de um ataque de negação de serviço (DDoS) que derrubou vários de seus serviços, incluindo a Wayback Machine, temporariamente interrompendo o trabalho de arquivamento. Em paralelo, processos judiciais contra a organização — movidos por editoras e gravadoras — ameaçam sua sustentabilidade. Recentemente, o Internet Archive perdeu um recurso em uma disputa com grandes editoras, que alegaram que a digitalização e o empréstimo de livros violam os direitos autorais. Outro processo de gravadoras ameaça impor uma multa de US$400 milhões à organização, valor que poderia comprometer a sua continuidade.

Chris Freeland, diretor de serviços de biblioteca do Internet Archive, reconhece que a organização enfrenta um futuro incerto. A recente parceria com o Google, que agora inclui links do Wayback Machine nos resultados de busca, é uma tentativa de ampliar o acesso e a sustentabilidade do projeto. Entretanto, essa parceria não garante a sua sobrevivência diante dos desafios financeiros e legais. Andrew Jackson, da Coalizão para a Preservação Digital, resume a situação ao afirmar que, embora o Internet Archive tenha se tornado um “pivô” essencial para a preservação digital, ele também é um “ponto crítico de falha”. A organização está sujeita a restrições legais e vulnerável a ataques, um indicativo de que nossa história digital depende perigosamente de uma única instituição.

A preservação do conhecimento digital é um projeto monumental, mas, ao delegarmos essa responsabilidade a poucos grupos, corremos o risco de perder nossa memória coletiva. A “amnésia digital” não é apenas uma questão técnica; é uma ameaça à continuidade de nossa identidade e de nosso legado cultural. Se queremos que nossa história sobreviva ao tempo, precisamos não apenas apoiar iniciativas como o Internet Archive, mas também adotar políticas públicas e educar a sociedade sobre a importância de registrar e proteger o conhecimento digital.