.
Opinião Quando duas histórias de extremos opostos do universo de TI se resumem à mesma coisa, soem as buzinas. No extremo da moda da tecnologia de IA, a Meta cumpriu a contragosto uma decisão de não inserir lixo das redes sociais europeias nos seus dados de treino. Enquanto isso, nas favelas industriais, 20% das instâncias do Microsoft SQL Server em execução já ultrapassaram o fim do suporte.
Num mundo mais são, essa segunda história teria a mesma proeminência nos principais meios de comunicação social que tudo o resto na IA e no crime cibernético que enche as manchetes. Os bancos de dados fazem o mundo girar. Eles são onde residem os dados de treinamento de IA, são onde os invasores de ransomware saqueiam. Eles guardam nosso dinheiro, nossa saúde, nossas vidas digitais. Eles estão no centro de todas as empresas, grandes ou pequenas. São também inexoravelmente monótonos, pelo menos para os normais, por isso, quando um em cada cinco casos de uma base de dados convencional está desatualizado num ambiente hostil, ninguém se importa. Pior ainda, nem um em cada cinco administradores de sistemas aqui. Se esses bancos de dados fossem leite na geladeira, você saberia sobre eles. Mas os bancos de dados não cheiram mal quando atingem a data de validade.
De volta ao Meta, a proibição dos dados de formação europeus por razões de privacidade é válida, mas mascara muitas questões não resolvidas. Como um LLM lida com mais de 20 idiomas diferentes? Nós realmente nem sabemos como isso lida com um. É uma área de pesquisa fascinante, com certeza, e não é uma área que você queira que seja disponibilizada amanhã para centenas de milhões de cidadãos. Uma questão maior, porém, é o que acontecerá quando produtos baseados em dados de formação gratuitos europeus forem lançados no mercado europeu.
Se os esforços para regular e eticizar a IA chegarem a algum lugar, eles minimizarão o uso de dados de treinamento tendenciosos que podem prejudicar os usuários no futuro. Se a IA fosse uma exploração leiteira, proibir os dados de formação europeus seria como proibir suplementos alimentares prejudiciais, e as directrizes éticas da IA impediriam a venda de leite de vacas mal alimentadas.
Hora da alimentação
Daí o encontro de nossas duas histórias no meio – ambas tratam da cadeia de fornecimento de software e serviços, apenas em cada extremidade. O que significa que já temos um modelo funcional de sistema que pode criar e aplicar melhores práticas com base em riscos e evidências de danos, independentemente dos detalhes da tecnologia. O que colocamos na boca é ainda mais íntimo do que o que colocamos no cérebro, por isso os padrões alimentares têm muito a nos ensinar.
O ambiente regulador das normas alimentares é um dos maiores sucessos do nosso tempo, embora em grande parte desconhecido e frequentemente utilizado como um peão político. A própria indústria alimentar é incontávelmente vasta e variada e ferozmente competitiva. Se um centavo puder ser raspado enquanto dois tirariam sangue, tenha os esparadrapos prontos. E, no entanto, ainda compramos os nossos alimentos enviados para todo o mundo, para os nossos supermercados, na presunção despreocupada de que foram preparados, enviados e vendidos, sendo mantidos perfeitamente seguros para consumo.
Diferentes regimes regulamentares são mais ou menos frouxos, com consequências claras – um em cada seis americanos adoece anualmente devido a doenças de origem alimentar, em comparação com um em cada 28 britânicos. Isso não é por causa da higiene pessoal meticulosa no velho país. Essas diferenças são uma escolha política. Como o Reino Unido tem uma cadeia alimentar perfeitamente funcional, uma regulamentação mais forte não impede o comércio e a inovação.
O sistema funciona, quando é permitido, num ciclo de feedback – são definidas regras e são feitas verificações suficientes para persuadir a indústria a cumpri-las e, quando as coisas correm mal, um regime de diagnóstico muito eficiente identifica o problema e rastreia-o até à origem. Normalmente, um aumento nas infecções transmitidas por alimentos desencadeia o sequenciamento do DNA do patógeno para estabelecer uma causa comum, juntamente com uma investigação sobre quem comeu o quê e quando. Os investigadores então percorrem a cadeia de abastecimento para encontrar uma fonte comum, que é então tratada.
É no mínimo discutível que o software de base de dados em fim de vida é um vector patogénico no final da cadeia de abastecimento. Se um grande número de sistemas semelhantes se tornarem vulneráveis, atrairão a atenção de agentes maliciosos que vêem grandes recompensas por menos trabalho. Os supermercados não podem vender alimentos desatualizados, então porque é que as empresas deveriam ser autorizadas a utilizar software desatualizado? Embora a subregulamentação do software signifique que há poucas ferramentas disponíveis para impor a higiene cibernética, existem opções. A indústria de seguros protege e indeniza as organizações, mas é altamente regulamentada. Seria realmente interessante invalidar aspectos disso quando software desatualizado fosse identificado e não corrigido.
No outro extremo da cadeia de abastecimento, onde software e serviços são criados e treinados, podem ser aplicados os mesmos princípios de controlo de riscos com base em evidências e danos potenciais encontrados nos alimentos. A inovação não é proibida, é encorajada e essencial, mas o risco potencial aumenta com o alcance e o impacto junto dos utilizadores. Os reguladores de dados europeus trabalham implicitamente com isto em mente; uma formulação explícita de princípio aqui também seria muito interessante.
A higiene alimentar, do campo ao prato, desenvolveu-se juntamente com a biologia das doenças desde o século XIX. A higiene cibernética só começou na década de 1980, com o co-desenvolvimento de vírus, monopólios de software e, mais recentemente, conectividade universal. Não admira que esteja um século atrasado. Até que isso mude, porém, espere ficar doente cibernético como um camponês medieval com o fluxo sangrento. Você realmente não quer isso. ®
.







