Estudos/Pesquisa

Método de alta velocidade usa menos poder computacional e pode ser útil para direção autônoma – Strong The One

.

Os pesquisadores desenvolveram uma nova maneira de alta velocidade para detectar a localização, tamanho e categoria de vários objetos sem adquirir imagens ou exigir reconstrução de cena complexa. Como a nova abordagem diminui bastante o poder de computação necessário para a detecção de objetos, ela pode ser útil para identificar perigos durante a condução.

“Nossa técnica é baseada em um detector de pixel único, que permite a detecção eficiente e robusta de vários objetos diretamente de um pequeno número de medições 2D”, disse o líder da equipe de pesquisa Liheng Bian, do Instituto de Tecnologia de Pequim, na China. “Espera-se que esse tipo de tecnologia de detecção sem imagem resolva os problemas de carga pesada de comunicação, alta sobrecarga de computação e baixa taxa de percepção dos sistemas de percepção visual existentes”.

Os métodos de percepção sem imagem de hoje só podem alcançar classificação, reconhecimento de objeto único ou rastreamento. Para realizar todos os três de uma vez, os pesquisadores desenvolveram uma técnica conhecida como detecção de objeto de pixel único sem imagem (SPOD). Na revista Optica Publishing Group letras ópticaseles relatam que o SPOD pode atingir uma precisão de detecção de objetos de pouco mais de 80%.

A técnica SPOD baseia-se nas realizações anteriores do grupo de pesquisa no desenvolvimento de tecnologia de detecção sem imagem como tecnologia de percepção de cena eficiente. Seu trabalho anterior inclui classificação sem imagem, segmentação e reconhecimento de caracteres com base em um detector de pixel único.

“Para direção autônoma, o SPOD pode ser usado com o lidar para ajudar a melhorar a velocidade de reconstrução da cena e a precisão da detecção de objetos”, disse Bian. “Acreditamos que ele tenha uma taxa de detecção e precisão altas o suficiente para direção autônoma, além de reduzir a largura de banda de transmissão e os requisitos de recursos de computação necessários para a detecção de objetos”.

Detecção sem imagens

A automatização de tarefas visuais avançadas – sejam usadas para navegar em um veículo ou rastrear um avião em movimento – geralmente requer imagens detalhadas de uma cena para extrair os recursos necessários para identificar um objeto. No entanto, isso requer hardware de imagem complexo ou complicados algoritmos de reconstrução, o que leva a alto custo computacional, longo tempo de execução e carga pesada de transmissão de dados.

Os métodos de detecção sem imagem baseados em detectores de pixel único podem reduzir o poder computacional necessário para a detecção de objetos. Em vez de empregar um detector pixelizado, como um CMOS ou CCD, a imagem de pixel único ilumina a cena com uma sequência de padrões de luz estruturados e, em seguida, registra a intensidade da luz transmitida para adquirir as informações espaciais dos objetos. Esta informação é então usada para reconstruir computacionalmente o objeto ou para calcular suas propriedades.

Para o SPOD, os pesquisadores usaram um padrão de luz estruturado pequeno, mas otimizado, para escanear rapidamente toda a cena e obter medições 2D. Essas medições são inseridas em um modelo de aprendizado profundo conhecido como codificador baseado em transformador para extrair os recursos significativos de alta dimensão na cena. Esses recursos são então alimentados em um decodificador baseado em rede de atenção multiescala, que gera as informações de classe, localização e tamanho de todos os alvos na cena simultaneamente.

“Comparado com o padrão de tamanho real usado por outros métodos de detecção de pixel único, o padrão pequeno e otimizado produz melhor desempenho de detecção sem imagem”, disse Lintao Peng, membro do grupo. “Além disso, a rede de atenção multiescala no decodificador SPOD reforça a atenção da rede para a área-alvo na cena. Isso permite uma extração mais eficiente dos recursos da cena, permitindo um desempenho de detecção de objetos de última geração.”

Demonstração de prova de conceito

Para demonstrar experimentalmente o SPOD, os pesquisadores construíram uma configuração de prova de conceito. Imagens selecionadas aleatoriamente do conjunto de dados do teste Pascal Voc 2012 foram impressas em filme e usadas como cenas-alvo. Quando uma taxa de amostragem de 5% foi usada, o tempo médio para completar a modulação de luz espacial e a detecção de objetos sem imagem por cena com SPOD foi de apenas 0,016 segundos. Isso é muito mais rápido do que realizar a reconstrução da cena primeiro (0,05 segundos) e depois a detecção do objeto (0,018 segundos. O SPOD mostrou uma precisão de detecção média de 82,2% para todas as classes de objetos incluídas no conjunto de dados de teste.

“Atualmente, o SPOD não pode detectar todas as categorias de objetos possíveis porque o conjunto de dados de detecção de objetos existente usado para treinar o modelo contém apenas 80 categorias”, disse Peng. “No entanto, quando confrontado com uma tarefa específica, o modelo pré-treinado pode ser ajustado para obter detecção multiobjeto sem imagem de novas classes de alvo para aplicações como detecção de pedestres, veículos ou barcos.”

Em seguida, os pesquisadores planejam estender a tecnologia de percepção sem imagem para outros tipos de detectores e sistemas de aquisição computacional para alcançar a tecnologia de detecção sem reconstrução.

.

Mostrar mais

Artigos relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Botão Voltar ao topo