Wayback Machine, que guarda mais de um bilhão de sites, enfrenta bloqueios crescentes de grandes jornais por medo do uso indevido em IA.
Há 30 anos, o Internet Archive mantém a história da web para jornalistas, pesquisadores e público geral.
Contudo, várias empresas de comunicação bloqueiam o acesso, ameaçando a preservação dos conteúdos na rede.
Este artigo explora os motivos dessa crise e suas possíveis consequências para a memória coletiva da internet.
O papel central da Wayback Machine na preservação da história digital
A plataforma Wayback Machine, do Internet Archive, armazena mais de um bilhão de sites e funciona como um arquivo vital para acessar conteúdos apagados ou alterados na internet.
Jornalistas, historiadores e juristas dependem dessa ferramenta para recuperar documentos que seriam inacessíveis, garantindo a transparência e continuidade da informação.
O projeto, baseado em São Francisco, representa uma biblioteca digital aberta e gratuita ao público, promovendo o acesso universal ao conhecimento.
Bloqueios crescentes pelas grandes empresas de comunicação
Conforme pesquisas da Nieman Foundation da Universidade de Harvard, pelo menos 241 portais de nove países bloquearam a Wayback Machine.
Entre eles estão veículos renomados como The Guardian, New York Times, Le Monde e USA Today.
Curiosamente, muitos desses jornais utilizam a plataforma para investigações, mas agora restringem o acesso por receio de como seus conteúdos são usados.
Preocupações com o uso de conteúdo para inteligência artificial
Empresas de jornalismo manifestam temor de que gigantes de IA, como OpenAI e Google, utilizem os conteúdos arquivados para treinar modelos de linguagem sem autorização e compensação.
Um porta-voz do New York Times explicou: “O problema é que os conteúdos do New York Times no Internet Archive são utilizados pelas empresas de IA, que infringem direitos autorais para concorrer diretamente conosco”.
A Wayback Machine enfrenta acessos intensos de robôs que solicitam milhares de dados por segundo, prejudicando os servidores da plataforma.
Impactos e desafios para a memória digital e o futuro do arquivamento
Especialistas alertam para a gravidade da situação: a perda do acesso integral prejudica a documentação das responsabilidades das plataformas digitais e dificulta pesquisas futuras.
Para o jornalista Martin Fehrensen, bloquear a Wayback Machine é contraditório, dado que jornalistas dependem do arquivo para reaver informações vitais.
Ele propõe um diálogo entre editores e plataformas para separar claramente o arquivamento público do uso de dados para IA, além de recomendar um status jurídico especial para arquivos digitais.
O ideal seria que o arquivamento da internet fosse tratado como infraestrutura pública, diminuindo a dependência de iniciativas isoladas como o Internet Archive.
Embora o Internet Archive tenha superado desafios como ataques hackers e processos judiciais recentes, esta crise estrutural é mais complexa, pois resulta de múltiplas decisões corporativas.
Mark Graham, diretor do Wayback Machine, reconhece a urgência da discussão para garantir a documentação completa da internet pública.
Com informações de G1
Aviso Legal:
O Noticias ES reúne, em um único lugar, as principais notícias publicadas pelos maiores portais do Espírito Santo. Organizamos e centralizamos as informações mais relevantes para que você acompanhe os acontecimentos do Estado com praticidade, transparência e respeito às fontes originais.