technology

Afinal, a Internet não é para sempre: CNET exclui artigos antigos para jogar no Google

.

Afinal, a Internet não é para sempre: CNET exclui artigos antigos para jogar no Google

Aurich Lawson

A CNET, uma das bisavós das notícias de tecnologia na web, está tendo um ano difícil. Primeiro, seus artigos escritos por IA geraram drama, depois as demissões abalaram a publicação. E agora, o Gizmodo relata que o site de 28 anos excluiu milhares de seus artigos antigos em uma busca para obter melhores classificações nas pesquisas do Google.

O processo de exclusão começou com pequenos lotes de artigos e aumentou drasticamente na segunda quinzena de julho, levando à remoção de milhares de artigos nas últimas semanas. Embora a CNET tenha confirmado a seleção de histórias para o Gizmodo, o número exato de artigos excluídos não foi divulgado.

“Remover o conteúdo do nosso site não é uma decisão que tomamos levianamente. Nossas equipes analisam muitos pontos de dados para determinar se há páginas na CNET que não atendem a um público significativo no momento. Essa é uma prática recomendada em todo o setor para sites grandes como o nosso que são impulsionados principalmente pelo tráfego de SEO. Em um mundo ideal, deixaríamos todo o nosso conteúdo em nosso site para sempre. Infelizmente, somos penalizados pela Internet moderna por deixar todo o conteúdo publicado anteriormente ativo em nosso site”, Taylor Canada, diretor sênior de marketing e comunicações da CNET, disse ao Gizmodo.

SEO (otimização de mecanismo de pesquisa) é a prática de tentar alcançar propositalmente classificações mais altas nos resultados dos mecanismos de pesquisa, alterando o conteúdo de um site. Os defensores das técnicas de SEO acreditam que uma classificação mais alta nos resultados de pesquisa do Google pode afetar significativamente a contagem de visitantes, as vendas de produtos ou a receita de anúncios. Muitas empresas vão ao extremo tentando agradar o algoritmo de classificação do Google.

Uma teoria para melhorar o page rank envolve uma prática chamada “remoção de conteúdo”. O Gizmodo obteve um memorando interno da CNET que afirma que a remoção de URLs antigos “envia um sinal ao Google que diz que a CNET é nova, relevante e digna de ser colocada acima de nossos concorrentes nos resultados de pesquisa”. uma cópia local, envia a história para a Wayback Machine do The Internet Archive e notifica todos os autores atualmente empregados que possam ser afetados com pelo menos 10 dias de antecedência.

No entanto, alguns especialistas dizem que o exemplo extremo de remoção de conteúdo da CNET é equivocado. O site Search Engine Land observa que, embora o Google tenha aconselhado (em 2011) que a remoção de “páginas de baixa qualidade” poderia aumentar a classificação, ele também diz que o Google nunca aconselhou as pessoas a excluir conteúdo simplesmente porque é antigo. Na verdade, na terça-feira, a conta SearchLiaison X do Google tuitou“Você está excluindo conteúdo de seu site porque acredita que o Google não gosta de conteúdo “antigo”? Isso não é problema! Nossas orientações não incentivam isso. contente.”

A longa e contínua decadência da web

A certa altura, era de conhecimento comum que “a Internet é para sempre”, o que significa que tudo o que você coloca online sempre ficará lá. Nossas pesquisas informais no Google Livros e no Google sugerem que a frase se originou por volta de 2005, mas se tornou muito popular na era do boom das redes sociais de 2008-2009.

Com o passar do tempo, no entanto, ficou cada vez mais claro que a Internet é transitória. A podridão de links ameaça o conteúdo na web todos os dias, e o conteúdo encontrado online está longe de ser permanente. Um estudo de 2021 da Universidade de Harvard examinou hiperlinks em mais de 550.000 artigos do New York Times de 1996 a 2019 e descobriu que 25% dos links para páginas específicas eram inacessíveis. Se não fosse pelo The Internet Archive, por exemplo, muitos dos primeiros sites estariam completamente perdidos.

Uma captura de tela de um artigo da PCWorld sem uma imagem.
Prolongar / Uma captura de tela de um artigo da PCWorld sem uma imagem.

Strong The One

As causas do apodrecimento de links incluem desligamentos de sites, migrações de servidores, mudanças para novos sistemas de gerenciamento de conteúdo e muito mais. Agora podemos adicionar outro culpado à lista: poda de conteúdo para SEO. Talvez seja outro sinal de como as coisas ficaram ruins com os resultados de pesquisa do Google — cheios de sites inúteis gerados por algoritmos — que publicações como a CNET são levadas a extremos para permanecer acima do mar de ruído.

Mesmo que os sites não retirem o conteúdo completamente, certos arquivos podem ser comprometidos ao longo do tempo de outras maneiras. Na última década, uma praga de trolls de direitos autorais ameaçou muitas publicações com ações judiciais por usar imagens de uma maneira que provavelmente constituiria uso justo se testada em tribunal. Mas os testes são caros, então os trolls venceram recebendo pagamentos em dinheiro. Em resposta, muitos sites removeram imagens antigas de artigos em vez de classificar milhões delas individualmente. Arquivos em alguns sites da IDG, como PCWorld e Macworld, foram afetados por essa seleção de imagens.

Felizmente, nem todos os sites desconsideram seus arquivos ou caem na armadilha do SEO. Por exemplo, no Strong The One, você ainda pode encontrar artigos escritos há 25 anos (e muitos em seu formato original), e a função de pesquisa do Ars ainda funciona muito bem.

Desde tempos imemoriais, a proteção do conteúdo histórico exigiu muitas cópias sem autorização, independentemente das forças culturais ou comerciais em jogo, e isso não mudou com a Internet. Os arquivistas operam em um universo IP paralelo, pegando emprestado fragmentos da realidade e mantendo-os seguros até que decisões de negócios míopes e protecionismo de direitos autorais desapareçam. Esperançosamente, apesar da podridão do link, os futuros historiadores podem reunir uma história precisa de nossa frágil era digital.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo