technology

Google pede que sites não abusem da Topics API • Strong The One

.

O Google planeja enviar sua API de tópicos quando o Chrome 115 chegar em 12 de julho. Essa é a API que deve permitir que os anunciantes direcionem aos internautas anúncios personalizados para seus interesses individuais, sem interferir na privacidade das pessoas.

E para ajudar a evitar esses problemas de privacidade, a gigante da publicidade está pedindo aos anunciantes que prometam que não abusarão desse mecanismo de segmentação de anúncios.

Em maio passado, Alexandre Gilotte, cientista sênior de dados e engenheiro de software da empresa de plataforma de anúncios Criteo, abriu uma discussão de problemas do GitHub descrevendo um possível ataque de impressão digital na API de tópicos que pode ser usado para identificar pessoas online.

Quinta-feira passada, com a Google a preparar-se para fazer Topics disponível no próximo mês no ChromeJosh Karlin, líder técnico e gerente do projeto Privacy Sandbox do Google, encerrou a discussão de um ano.

“Desde esta discussão, adicionamos um requisito no Chrome que os desenvolvedores matricular usar a API e atestar que não abusarão da API”, ele escreveu. “Essa não é uma solução técnica, mas acredito que é um longo caminho para resolver esse problema. Fechando por enquanto.”

Permanece uma questão em aberto, no entanto, se outros fabricantes de navegadores suportarão a API. Ambos criadores do Firefox Mozilla e desenvolvedor Safari Maçã indicaram que se opõem à proposta dos Tópicos.

Simplesmente não conseguimos ver uma maneira de fazer isso funcionar do ponto de vista da privacidade

“Fundamentalmente, simplesmente não conseguimos ver uma maneira de fazer isso funcionar do ponto de vista da privacidade”, disse O distinto engenheiro da Mozilla, Martin Thomson, em janeiro, em resposta a um pedido de declaração de posição oficial de Karlin.

“Embora as informações fornecidas pela API sejam pequenas, acreditamos que é mais provável que isso reduza a utilidade das informações para os anunciantes do que forneça uma proteção significativa para a privacidade. Infelizmente, é difícil identificar maneiras concretas de melhorar isso .”

Anne van Kesteren, que trabalha com padrões da web na Apple, citou dez questões com a API e declarou que o iGiant se opõe a ela. “Não achamos que dados entre sites sobre o comportamento de navegação do usuário devam ser expostos em APIs”, disse ele. “Estamos trabalhando há dez anos na direção oposta, particionando dados por site de alto nível.”

Google, tendo no ano passado abandonado sua API anterior baseada em interesses, Aprendizado Federado de Coortes (FLoC), ainda assim está avançando com os Tópicos porque precisa de algo que permita a publicidade baseada em interesses, uma vez que o já atrasado depreciação de cookies de terceiros ocorre no terceiro trimestre de 2024.

Como funciona a API

O API de tópicos é uma das várias propostas que possivelmente preservam a privacidade para lidar com a publicidade digital, uma vez que o suporte para cookies de terceiros desapareça. Parte do que o Google vem chamando de Privacy Sandbox, o Topics fornece um mecanismo para veicular anúncios que correspondem aos interesses inferidos dos usuários da web.

Basicamente, quando um usuário visita um site e o site deseja exibir um anúncio, o site pode executar o código JavaScript (ou verificar o cabeçalho da solicitação Sec-Browsing-Topics) para buscar uma lista de até três tópicos, de uma taxonomia de vários centenas de categorias de interesse, derivadas das visitas anteriores do usuário ao site. Isso permite que o site exiba um anúncio considerado relevante para os interesses conhecidos do visitante.

“Com os Tópicos, seu navegador determina um punhado de tópicos, como ‘Fitness’ ou ‘Viagem e Transporte’, que representam seus principais interesses naquela semana com base em seu histórico de navegação”, explicou Vinay Goel, diretor de produto da Privacy Sandbox no Google, no ano passado.

“Os tópicos são mantidos por apenas três semanas e os tópicos antigos são excluídos. Os tópicos são selecionados inteiramente em seu dispositivo sem envolver nenhum servidor externo, incluindo os servidores do Google. Quando você visita um site participante, os tópicos selecionam apenas três tópicos, um tópico de cada um dos últimas três semanas, para compartilhar com o site e seus parceiros de publicidade.”

A API ocasionalmente também pode retornar um tópico aleatório. Em navegadores que suportam Tópicos, como o próximo Chrome 115, uma página da Web invocando a API assim…

const topics = await document.browsingTopics();

…pode retornar um array formatado assim…

[{'configVersion': String, 'modelVersion': String, 'taxonomyVersion': String, 'topic': Number, 'version': String}]

…onde “Número” corresponde a um numerado taxonomia de interesses predefinidos. O valor “1” refere-se a “/Artes e Entretenimento”, enquanto o número 277 refere-se a “/Empregos e Educação/Educação/Estudo de Língua Estrangeira”.

Armado com essas informações, o código da página da Web poderia solicitar um anúncio relacionado ao tópico, o que idealmente envolveria melhor o visitante da Web e geraria mais receita porque o anunciante pagaria um prêmio para atingir o público desejado.

A preocupação de Gilotte é que um editor da Web possa implementar a API de tópicos incluindo o JavaScript necessário em vários sites e, em seguida, criar um identificador de impressão digital com base em como os sites se comportam para o usuário.

A API de tópicos tem um requisito de “testemunha” – ela só revela o interesse de um visitante em um tópico se o site já tiver recebido dados nessa categoria de tópico. Portanto, um script em uma página da Web que observa um usuário visitando um site de notícias pode aprender que o usuário tem afinidade por notícias, mas não que o usuário está interessado em, digamos, fazer compras.

Essa regra – que o Google chama de “requisito de filtragem por chamador” e pode ajudar Google mais do que empresas menores com menos visibilidade em visitas na web – pode ser explorado para ganhar um pouco de entropia sobre o visitante: se o site viu ou não o tópico.

Com bits suficientes de entropia, você obtém uma impressão digital – estamos falando de dezenas de sites ao longo de semanas de observação. Segundo Thomson, da Mozilla, 20 bits permite diferenciação de um em um milhão. E ele detalha suas preocupações em um papel [PDF] publicado em janeiro intitulado “Uma análise de privacidade da proposta de tópicos do Google”.

“Concluímos que o Topics tem desafios de privacidade significativos e estruturais que são difíceis de remediar”, escreveu Thomson.

resposta do Google

Em uma tentativa de abordar algumas das preocupações que surgiram, Karlin e outros do Google argumentam que o Topics oferece melhor privacidade do que os cookies de terceiros – que não oferecem muita privacidade. Em abril, ele e dez colegas lançaram um papel [PDF] delineando a matemática para avaliar essa afirmação.

E no início deste mês, o Google anunciado algumas alterações na API de tópicos.

uma nova taxonomia de 469 tópicos de interesse, contra 349 anteriormente. Este é menor que o Taxonomia de público-alvo do IAB, que o Google diz conter cerca de 1.500 tópicos. Cerca de 280 categorias com foco comercial, como roupas esportivas, colchões e viagens de luxo, foram adicionadas, enquanto 160 categorias menos monetizáveis, como engenharia civil e hipismo, foram removidas.

“Escolhemos limitar o tamanho da taxonomia, para proteger contra o risco de reidentificação”, explicou Leeron Israel, gerente de produto do Privacy Sandbox do Google.

O Google, disse Israel, também planeja permitir que os usuários bloqueiem tópicos específicos. “Isso significa que os usuários poderão selecionar o conjunto de tópicos disponíveis nos quais estão interessados, removendo os tópicos selecionados”, disse ele. “Essa mudança, que acontecerá no início do ano que vem, dará aos usuários ainda mais controle sobre sua privacidade e tornará a API de tópicos ainda mais fácil de usar.”

A Mozilla não está convencida.

“Não estamos entusiasmados com a criação de recursos que revelam o histórico de navegação das pessoas”, disse um porta-voz da empresa. Strong The One em um e-mail.

“O Google se contenta em utilizar ruído de baixo nível para oferecer uma sensação de privacidade. Randomizar os dados a uma taxa de um em vinte pode diminuir sua eficácia para publicidade, mas não é um grande consolo para aqueles que são reidentificados usando essa informação.”

Evidentemente, haverá um interruptor. ®

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo