.
What3Words, o site e aplicativo que traduz coordenadas físicas em combinações curtas e memoráveis de palavras, tem sido elogiado e criticado ao longo dos anos.
Agora, um cientista da computação da Universidade de Exeter, no Reino Unido, descreveu formalmente em um artigo como a confusão pode surgir a partir do algoritmo de geocodificação usado pelo What3Words, e questionou sua adequação para direcionar serviços de emergência para locais de incidentes.
What3Words (W3W) remonta a 2013. É um aplicativo que usa um sistema de geocodificação proprietário para mapear coordenadas geográficas para um conjunto de três palavras, porque números longos tendem a ser mais difíceis para as pessoas lembrarem e comunicarem do que palavras.
O sistema funciona dividindo o mundo em uma grade de quadrados de três metros e atribuindo três palavras de um conjunto de dados de aproximadamente 40.000 palavras para cada quadrado. Assim, a latitude e longitude da Prefeitura de Nova York (40.712772, -74.006058) mapeia para clip.maçãs.leapque normalmente seria mais fácil de lembrar, dizer ou digitar em um dispositivo móvel.
O aplicativo, segundo a empresa, é usado em 170 países por milhares de empresas, além de governos e ONGs. Ele recebeu endossos no Reino Unido, da Automobile Association (AA) e de alguns grupos de serviços de emergência, que aconselharam os viajantes a usar o aplicativo W3W caso precisem comunicar seu paradeiro. Os criadores do aplicativo descreveram o W3W como uma “ferramenta adicional” que os serviços de emergência em todo o mundo podem usar para localizar chamadores.
Mas o aplicativo também é alvo de críticas constantes, documentadas no site Quais são as 3 palavras que são uma bagunça. O site lista diversas notícias e reportagens de mídia social que citam problemas decorrentes do uso de endereços W3W.
Apontando para essas preocupações, Rudy Arthur, professor sênior de ciência de dados na Universidade de Exeter, analisou o algoritmo de geocodificação W3W, conforme descrito no relatório da empresa depósito de patente porque o código da empresa está fechado ao escrutínio.
“Se o W3W for amplamente adotado pelos serviços de emergência, deverá ser sujeito a uma avaliação rigorosa”, explicou ele em um papel pré-impresso intitulado: “Uma análise crítica do algoritmo de geocodificação What3Words.”
Strong The One contatou Arthur para falar sobre suas descobertas, mas ele recusou, afirmando que espera que o artigo seja publicado em uma revista acadêmica e que prefere esperar até que o processo de revisão por pares seja concluído antes de discutir o trabalho.
Arthur, em seu artigo, diz que, embora não tenha conhecimento de análises acadêmicas formais anteriores do W3W, houve postagens públicas de especialistas técnicos que levantaram preocupações sobre o esquema de geocodificação. Por exemplo, há dois anos, o testador de penetração Andrew “Cybergibbons” Tierney argumentou o algoritmo pode criar confusão se as pessoas pluralizarem/despluralizarem palavras incorretamente ou interpretarem mal as palavras faladas como grafias homófonas.
Tierney observou que o W3W afirmou que “as pessoas confundem os plurais apenas cerca de 5% das vezes quando os ouvem lidos em voz alta”, o que, segundo ele, significa que a chance de um endereço W3W ser confundido apenas com base nos plurais é de uma em 27.
A W3W, por outro lado, afirma que a possibilidade de confusão é muito mais remota.
“Digamos que existam 10.000 combinações potencialmente confusas e ambiguamente próximas umas das outras no Reino Unido”, disse a empresa. disse ao abordar essas preocupações em 2021. “Isso é 1 em 2,5 milhões (0,00004 por cento) de chance geral de atingir um quadrado que poderia ser considerado como tendo um quadrado próximo com um endereço confusamente semelhante.”
W3W também afirmou: “A esmagadora proporção de combinações de 3 palavras com sons semelhantes estarão tão distantes umas das outras que um erro será óbvio.”
A consequência de tal confusão no contexto dos serviços de emergência inclui cenários como ambulâncias direcionadas para o local errado, em potencial prejuízo daqueles que necessitam de assistência.
O artigo de Arthur identifica 14 modos distintos nos quais erros podem ser introduzidos na transmissão oral ou escrita de trigêmeos de palavras. Isso inclui erros de digitação, homófonos, substituições de autocorreção, variações ortográficas regionais, incerteza sobre os limites das palavras (“dogs.tart” ou “dog.start”) e assim por diante.
Como exemplo retirado do artigo de Arthur sobre possibilidades de erro apenas homófono, o local “arose.recede.home” tem um conjunto de confusão que consiste em “arrows.recede.home”, “arose.reseed.home” e “arrows.reseed .lar.” Ou seja, esses são erros potenciais de som que podem ser introduzidos ao tentar transmitir um endereço W3W para outra pessoa.
Estimo que 20-25 por cento dos endereços têm mais de três outros endereços com os quais podem ser confundidos
É difícil avaliar a frequência desses modos de erro, diz o cientista de dados, devido aos termos restritivos da licença W3W. Ele, no entanto, fez o código para sua análise de dados público.
“Eu estimo que 20-25 por cento dos endereços têm mais de três outros endereços com os quais poderiam ser confundidos, considerando apenas homófonos e erros de digitação”, diz Arthur em seu artigo. “Assim, pode ser muito difícil, se não impossível, decifrar um endereço mal comunicado com o sistema atual.”
“Ao contrário do que afirma o W3W, este trabalho mostrou que é provável que existam muitos endereços W3W confundíveis e identificou alguns problemas sérios com o algoritmo W3W. No entanto, embora mostre que existem muitos pares confundíveis, este trabalho não mostra que eles vai estar confuso.”
Apontando para os vários outros sistemas de geocodificação que estão sendo usados – GeoHash, Natural Area Codes, Plus Codes (também conhecido como Open Location Code), o Military Grid Reference System e o Maidenhead Locator System – Arthur sugere o Levantamento de artilharia O sistema de referência National Grid seria mais adequado para aplicações de serviços de emergência no Reino Unido.
What3Words não respondeu aos pedidos de comentários, mas já contado à BBC que o erro humano é “uma possibilidade com qualquer tipo de ferramenta”. ®
.