.
Engenheiros do Instituto de Tecnologia de Tóquio (Tokyo Tech) demonstraram uma abordagem computacional simples para melhorar a maneira como os classificadores de inteligência artificial, como redes neurais, podem ser treinados com base em quantidades limitadas de dados do sensor. As aplicações emergentes da internet das coisas geralmente exigem dispositivos de ponta que possam classificar com segurança comportamentos e situações com base em séries temporais. No entanto, os dados de treinamento são difíceis e caros de adquirir. A abordagem proposta promete aumentar substancialmente a qualidade do treinamento do classificador, quase sem nenhum custo extra.
Nos últimos tempos, ganhou terreno a perspectiva de ter um grande número de sensores da Internet das Coisas (IoT) monitorando silenciosa e diligentemente inúmeros aspectos das atividades humanas, naturais e das máquinas. À medida que nossa sociedade se torna cada vez mais ávida por dados, cientistas, engenheiros e estrategistas esperam cada vez mais que a visão adicional que podemos obter desse monitoramento abrangente melhore a qualidade e a eficiência de muitos processos de produção, resultando também em maior sustentabilidade.
O mundo em que vivemos é incrivelmente complexo, e essa complexidade se reflete em uma enorme variedade de variáveis que os sensores de IoT podem ser projetados para monitorar. Alguns são naturais, como a quantidade de luz solar, umidade ou o movimento de um animal, enquanto outros são artificiais, por exemplo, o número de carros que cruzam um cruzamento ou a tensão aplicada a uma estrutura suspensa como uma ponte. O que todas essas variáveis têm em comum é que elas evoluem ao longo do tempo, criando o que é conhecido como série temporal, e espera-se que informações significativas estejam contidas em suas mudanças implacáveis. Em muitos casos, os pesquisadores estão interessados em classificar um conjunto de condições ou situações pré-determinadas com base nessas mudanças temporais, como forma de reduzir a quantidade de dados e torná-los mais fáceis de entender. Por exemplo, medir a frequência com que uma determinada condição ou situação surge é muitas vezes tomado como base para detectar e compreender a origem de avarias, aumentos de poluição e assim por diante.
Alguns tipos de sensores medem variáveis que em si mudam muito lentamente ao longo do tempo, como a umidade. Nesses casos, é possível transmitir cada leitura individual por uma rede sem fio para um servidor em nuvem, onde ocorre a análise de grandes quantidades de dados agregados. No entanto, cada vez mais aplicações exigem variáveis de medição que mudam rapidamente, como as acelerações que acompanham o comportamento de um animal ou a atividade diária de uma pessoa. Como muitas leituras por segundo são frequentemente necessárias, torna-se impraticável ou impossível transmitir os dados brutos sem fio, devido a limitações de energia disponível, cobrança de dados e, em locais remotos, largura de banda. Para contornar esse problema, engenheiros de todo o mundo há muito procuram maneiras inteligentes e eficientes de extrair aspectos da análise de dados da nuvem e colocá-los nos próprios nós do sensor. Isso geralmente é chamado de inteligência artificial de ponta ou IA de ponta. Em termos gerais, a ideia é enviar sem fio não as gravações brutas, mas os resultados de um algoritmo de classificação em busca de condições particulares ou situações de interesse, resultando em uma quantidade muito mais limitada de dados de cada nó.
Há, no entanto, muitos desafios a enfrentar. Alguns são físicos e decorrem da necessidade de encaixar um bom classificador no que geralmente é uma quantidade bastante limitada de espaço e peso e, muitas vezes, fazê-lo funcionar com uma quantidade muito pequena de energia para que a bateria de longa duração possa ser alcançada. “Boas soluções de engenharia para esses requisitos estão surgindo todos os dias, mas o verdadeiro desafio que impede muitas soluções do mundo real é outro. A precisão da classificação geralmente não é boa o suficiente e a sociedade exige respostas confiáveis para começar a confiar em uma tecnologia”, diz o Dr. Hiroyuki Ito, chefe da Unidade de Nano Sensing onde o estudo foi conduzido. “Muitas aplicações exemplares de inteligência artificial, como carros autônomos, mostraram que o quão bom ou ruim é um classificador artificial depende muito da qualidade dos dados usados para treiná-lo. Mas, na maioria das vezes, os dados da série temporal do sensor são realmente exigente e caro para adquirir no campo. Por exemplo, considerando o monitoramento do comportamento do gado, para adquiri-lo, os engenheiros precisam passar algum tempo nas fazendas, instrumentando vacas individuais e tendo especialistas anotando pacientemente seu comportamento com base em imagens de vídeo”, acrescenta o co-autor Dr. Korkut Kaan Tokgoz, anteriormente parte da mesma unidade de pesquisa e agora com Sabanci University na Turquia.
Como consequência do fato de que os dados de treinamento são tão preciosos, os engenheiros começaram a procurar novas maneiras de aproveitar ao máximo uma quantidade bastante limitada de dados disponíveis para treinar dispositivos de IA de ponta. Uma tendência importante nessa área é o uso de técnicas conhecidas como “aumento de dados”, em que algumas manipulações, consideradas razoáveis com base na experiência, são aplicadas aos dados registrados para tentar imitar a variabilidade e a incerteza que podem ser encontradas em aplicações reais. “Por exemplo, em nosso trabalho anterior, simulamos a rotação imprevisível de uma coleira contendo um sensor de aceleração em volta do pescoço de uma vaca monitorada e descobrimos que os dados adicionais gerados dessa maneira poderiam realmente melhorar o desempenho na classificação do comportamento”, explica Sra. Chao Li, estudante de doutorado e principal autora do estudo [1]. “No entanto, também percebemos que precisávamos de uma abordagem muito mais geral para aumentar a série temporal do sensor, uma que pudesse, em princípio, ser usada para qualquer tipo de dados e não fazer suposições específicas sobre a condição de medição. Além disso, em situações do mundo real, Na verdade, existem dois problemas, relacionados, mas distintos. O primeiro é que a quantidade geral de dados de treinamento costuma ser limitada. O segundo é que algumas situações ou condições ocorrem com muito mais frequência do que outras, e isso é inevitável. Por exemplo, as vacas gastam naturalmente muito mais tempo descansando ou ruminando do que bebendo. No entanto, medir com precisão os comportamentos menos frequentes é essencial para julgar adequadamente o estado de bem-estar de um animal. Uma vaca que não bebe certamente sucumbirá, mesmo que a precisão da classificação de beber possa ter baixo impacto em abordagens de treinamento comuns devido à sua raridade. Isso é chamado de problema de desequilíbrio de dados”, acrescenta ela.
A pesquisa computacional realizada pelos pesquisadores da Tokyo Tech e inicialmente voltada para melhorar o monitoramento do comportamento do gado oferece uma possível solução para esses problemas, combinando duas abordagens muito diferentes e complementares. A primeira é conhecida como amostragem, e consiste em extrair “snippets” de séries temporais correspondentes às condições a serem classificadas sempre a partir de instantes diferentes e aleatórios. Quantos snippets são extraídos é ajustado cuidadosamente, garantindo que sempre se tenha aproximadamente o mesmo número de snippets em todos os comportamentos a serem classificados, independentemente de quão comuns ou raros sejam. Isso resulta em um conjunto de dados mais equilibrado, que é decididamente preferível como base para o treinamento de qualquer classificador, como uma rede neural. Como o procedimento é baseado na seleção de subconjuntos de dados reais, é seguro evitar a geração de artefatos que podem resultar da síntese artificial de novos trechos para compensar os comportamentos menos representados. O segundo é conhecido como dados substitutos e envolve um procedimento numérico muito robusto para gerar, a partir de qualquer série temporal existente, qualquer número de novos que preservam algumas características-chave, mas são completamente não correlacionados. “Essa combinação virtuosa acabou sendo muito importante, porque a amostragem pode causar muita duplicação dos mesmos dados, quando certos comportamentos são muito raros em relação a outros. Os dados substitutos nunca são os mesmos e evitam esse problema, que pode afetar muito negativamente o processo de treinamento. E um aspecto fundamental deste trabalho é que o aumento de dados é integrado ao processo de treinamento, portanto, dados diferentes são sempre apresentados à rede ao longo de seu treinamento”, explica o Sr. Jim Bartels, coautor e aluno de doutorado na unidade.
As séries temporais substitutas são geradas misturando completamente as fases de um ou mais sinais, tornando-os totalmente irreconhecíveis quando suas mudanças ao longo do tempo são consideradas. No entanto, a distribuição de valores, a autocorrelação e, se houver sinais múltiplos, a correlação cruzada, são perfeitamente preservadas. “Em outro trabalho anterior, descobrimos que muitas operações empíricas, como reversão e recombinação de séries temporais, na verdade ajudaram a melhorar o treinamento. geração são provavelmente a chave para o desempenho, pelo menos para a aplicação do reconhecimento do comportamento da vaca em que me concentro”, explica ainda a Sra. Chao Li [2]. “O método de séries temporais substitutas se origina de um campo totalmente diferente, ou seja, o estudo da dinâmica não linear em sistemas complexos como o cérebro, para o qual tais séries temporais são usadas para ajudar a distinguir o comportamento caótico do ruído. Ao reunir nossas diferentes experiências, nós rapidamente percebi que eles também poderiam ser úteis para esta aplicação”, acrescenta o Dr. Ludovico Minati, segundo autor do estudo e também da Unidade de Nano Sensing. “No entanto, muito cuidado é necessário porque não há dois cenários de aplicação iguais, e o que vale para a série temporal que reflete o comportamento das vacas pode não ser válido para outros sensores que monitoram diferentes tipos de dinâmica. Em qualquer caso, a elegância da proposta método é que é bastante essencial, simples e genérico. Portanto, será fácil para outros pesquisadores experimentá-lo rapidamente em seus problemas específicos”, acrescenta.
Após esta entrevista, a equipa explicou que este tipo de investigação será aplicado, antes de mais, no melhoramento da classificação de comportamentos bovinos, para o que foi inicialmente destinado e sobre o qual a unidade desenvolve investigação multidisciplinar em parceria com outras universidades e empresas. “Um dos nossos principais objetivos é demonstrar com sucesso alta precisão em um dispositivo pequeno e barato que pode monitorar uma vaca durante toda a sua vida, permitindo a detecção precoce de doenças e, portanto, melhorando não apenas o bem-estar animal, mas também a eficiência e a sustentabilidade da criação. ” conclui o Dr. Hiroyuki Ito. A metodologia e os resultados são relatados em um artigo recente publicado na revista Sensores IEEE [3].
.