.
O que você precisa saber
- A mais recente expansão do Google Tradutor abrange idiomas falados por mais de 614 milhões de pessoas, cerca de 8% da população global.
- As novas línguas vão desde aquelas amplamente faladas até dialetos indígenas e até mesmo aquelas sem falantes nativos atuais.
- O modelo de linguagem PaLM 2 do Google foi crucial para adicionar idiomas relacionados ao hindi e ao crioulo francês.
- Cerca de um quarto das novas adições são línguas africanas como Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof.
A inteligência artificial está ajudando o Google Translate a se expandir com 110 novos idiomas, que é sua maior atualização até agora.
O Google anunciou em um post de blog que essa enorme expansão inclui idiomas falados por mais de 614 milhões de pessoas no mundo todo, ou cerca de 8% da população global. A variedade é incrível, desde os idiomas amplamente falados no mundo, falados por mais de 100 milhões de pessoas, até os dialetos estimados de comunidades indígenas.
Até mesmo idiomas sem falantes nativos estão incluídos, mostrando a dedicação do Google em preservar línguas ameaçadas de extinção.
Somando-se a essa atualização impressionante, o Google se concentrou em línguas africanas, compondo cerca de um quarto das novas adições. Línguas como Fon, Kikongo, Luo, Ga, Swati, Venda e Wolof agora fazem parte do Google Translate, marcando seu avanço mais significativo em línguas africanas até agora.
O modelo de idioma grande PaLM 2 do Google foi crucial na expansão do Translate. Ele aprende idiomas relacionados, permitindo a adição de línguas relacionadas ao hindi, como awadhi e marwadi, bem como crioulos franceses, como seichelense e mauriciano.
Enquanto isso, adicionar idiomas amplamente falados, como o cantonês, traz seu próprio conjunto de desafios devido aos caracteres escritos compartilhados com o mandarim. Apesar destes obstáculos, a dedicação do Google à diversidade linguística brilha. Um excelente exemplo é a inclusão do Manx, uma língua celta da Ilha de Man que quase foi extinta em 1974. Graças aos esforços de revitalização, a fluência aumentou para milhares.
Esta expansão também inclui o punjabi escrito na escrita Shahmukhi, uma variante perso-árabe usada no Paquistão, onde é a língua mais falada.
O Google reconhece que traduzir idiomas não é fácil devido a variações regionais, dialetos e diferenças ortográficas. Algumas línguas, como o Romani, com seus muitos dialetos, não possuem uma única versão padrão, o que torna a tradução complicada.
Antes desta expansão, a maior atualização do Google Translate ocorreu em maio de 2022 com a introdução da tradução automática Zero-Shot. Esta tecnologia permite que o modelo aprenda novos idiomas sem a necessidade de exemplos traduzidos pré-existentes. Este foi um grande avanço na tradução automática, ajudando o Google a preencher ainda mais as lacunas linguísticas.
Esta expansão é um passo importante em direção à Iniciativa 1.000 Idiomas do Google, que visa usar modelos de IA para apoiar os 1.000 principais idiomas do mundo.
.