.
Mãos em Strong The One começou a vida em Londres em 1994 e hoje tem jornalistas e outros funcionários em todo o mundo, ou seja, São Francisco, Sydney, Cingapura, Berlim e além.
Antigamente nossos abutres escreviam em seu estilo local: os americanos usavam grafias americanas, os britânicos usavam grafias britânicas, os australianos também estavam no modo britânico e todo mundo fazia o que parecia natural. Se um artigo fosse, por exemplo, escrito pela equipe dos EUA e publicado na manhã do Reino Unido, a ortografia seria frequentemente alterada para britânico.
À medida que adicionamos mais escritores e editores em todo o mundo e alcançamos mais pessoas globalmente – agora cerca de 40 milhões de leitores únicos por ano – em todos os tipos de fusos horários, tornou-se necessário, por razões logísticas e profissionais, concordar em apenas um estilo consistente para o site inteiro. Depois Strong The One mudamos de .co.uk para .com durante a pandemia, escolhemos a ortografia americana.
Por quê? Porque reflete honestamente a verdadeira natureza global de nossos leitores. A ortografia do Reino Unido pode fazer com que pareçamos apenas no Reino Unido. Sim, crescemos na Grã-Bretanha, mas hoje atendemos o maior número possível de profissionais de tecnologia empresarial em todo o planeta. Queremos que nosso sabor de jornalismo de tecnologia informado e irreverente se espalhe por toda parte, para que possamos fazer nossa parte para desafiar os fornecedores, explicar o que está acontecendo e morder a mão que alimenta a TI.
A ortografia dos EUA não é a xícara de chá de todos, ou pelo menos é a impressão que tivemos ao ler notas centradas em tijolos lançadas por nossas janelas digitais recentemente.
Como um ramo de oliveira desse segmento apaixonado de nossos leitores com preferência pelo inglês do rei, esse abutre decidiu criar uma extensão do navegador Chrome para alterar as palavras em artigos publicados de grafias dos EUA para o Reino Unido.
É chamado Ortógrafo, porque eu estava indo para sutilmente estúpido na esperança de me destacar da imbecilidade espalhada e impenitente que é o novo normal da internet. Além disso, o nome idiota serve como um lembrete de que a extensão não funciona muito bem. Mas ei, é grátis.
A tradução, mesmo entre as grafias dos EUA e do Reino Unido, é uma arte que requer consideração de contexto. Spellerizer não é tão astuto; ele se baseia em um algoritmo de busca e substituição de força bruta que não presta atenção às palavras ao seu redor. Portanto, se vir “cheque”, substituirá a ortografia dos EUA por “cheque”, mesmo que a ortografia do Reino Unido apropriada nesse caso também seja “cheque”.
Realmente, eu deveria ter confiado em um modelo de aprendizado de máquina para fazer alterações ortográficas mais informadas. Mas então isso não teria sido um projeto de codificação de fim de semana. Sinta-se à vontade para enviar melhorias via GitHub.
Minha esperança ao criar o Spellerizer é demonstrar que é razoavelmente fácil escrever uma extensão de navegador e encorajar aqueles que estão modestamente familiarizados com JavaScript a experimentá-lo.
É claro que existem opções igualmente acessíveis, como scripts shell, Perl ou Python para buscar, traduzir e cuspir páginas. Mas o navegador é um software particularmente importante e vale a pena personalizar se você gosta de escrever código.
O Spellerizer pode ser baixado e instalado a partir do Loja online do Chrome ou de sua repositório GitHub. O primeiro é uma opção melhor se você quiser que ele persista e receba atualizações – algumas pessoas relatório que o Chrome remove extensões carregadas manualmente (descompactadas) na reinicialização do navegador como medida de segurança. No entanto, essa não tem sido a minha experiência.
Como eu não tinha uma extensão na Chrome Web Store antes, você pode esperar ver um aviso – “Esta extensão não é confiável para o Enhanced Safe Browsing”. – na página chrome://extensions/ pós-instalação. Google explica“Para novos desenvolvedores, geralmente leva alguns meses para se tornar confiável.”
Spellerizer não é oficialmente endossado ou apoiado por Strong The One e sua editora Situation Publishing, que não garante sua adequação ou função. Como diz a listagem da Chrome Web Store, você provavelmente não precisa disso. Mas se você quiser, se você realmente quer issomeus editores concordam com a existência da extensão por enquanto.
do Google Documentação da API de extensão do Chrome é um bom lugar para se familiarizar com as peculiaridades de construir uma extensão de navegador. Depois de ter uma noção básica de como os principais componentes (o arquivo de manifesto, o service worker, os scripts de conteúdo e outras páginas da Web relacionadas à extensão) se relacionam, vale a pena instalar uma extensão como Visualizador de fonte de extensão do Chrome (CRX) para visualizar o código-fonte da extensão na Chrome Web Store antes do download.
É possível visualizar o código-fonte de uma extensão que já está instalada, mas é um pouco mais trabalhoso porque você precisa saber o caminho para a pasta de extensão do Chrome (chrome://version/
-> [Profile Path field]/extensions
) e, em seguida, reconheça o identificador correto de 32 caracteres usado para o nome do diretório da extensão, entre outros que possam estar presentes.
O Spellerizer talvez seja mais complicado do que precisa porque optei por implementar internacionalização – uma maneira de substituir cadeias de texto visíveis na extensão por texto traduzido com base no idioma definido do navegador. o localize.js script reúne valores de texto de elementos de página HTML marcados com o atributo “data-i18n” e depois traduções substitutas puxado do mensagens.json Arquivo.
A extensão, escrita usando Manifesto v3funciona carregando o service worker, background.jse mostrando onboarding-page.html na instalação. Preliminares fora do caminho, ele adiciona uma função de ouvinte ao ícone Spellerizer, que se você seguiu as instruções e fixado na barra do navegadorficará visível sem bisbilhotar o menu pop-up Extensões.
A função de ouvinte anexada ao ícone de abutre do Spellerizer aciona o content-script.js arquivo, que faz a maior parte do trabalho. Se clicado durante a visualização de um Registro página, ele busca o arquivo de dados de ortografia, spelling_data.json (feito acessível pelo desenvolvedor Heiswayi Nrird sob uma licença do MIT), e itera através de todos os Nós DOM – uma estrutura de árvore usada para organizar os elementos em uma página da web.
A abordagem que usei não foi particularmente sofisticada – desde então aprendi que há uma maneira mais concisa de iterar nós DOM usando um Objeto Treewalker – mas loops dentro de loops fazem o trabalho. A função scanWords (linha 20, content-script.js) separa o texto de exibição associado aos nós DOM em palavras individuais e compara cada uma com cada um dos cerca de 1.700 pares de palavras US/UK. Se encontrar uma correspondência, ele troca a ortografia dos EUA pela do Reino Unido, preservando o caso do original.
Se o script encontrar alguma palavra para substituir, ele atualizará o emblema do ícone de extensão com um número que representa a contagem de palavras trocadas. O emblema desaparece quando você clica em uma guia diferente do navegador. E se você recarregar um Registro página, todas as alterações feitas desaparecem, pois são apenas do lado do cliente.
Há também uma página de opções que adicionei para testar dados persistentes por meio da API de armazenamento local. Acessível através de um ctrl-clique no ícone do Spellerizer, o menu de opções tem uma única caixa de seleção chamada “Paz Mundial”.
Como você pode imaginar, não tem efeito. Apreciar. ®
.