.
Fundador e CEO da Figura Brett Adcock na quinta -feira revelado Um novo modelo de aprendizado de máquina para robôs humanóides. A notícia, que chega duas semanas depois que a Adcock anunciou que a decisão da empresa de robótica da Bay Area de se afastar de uma colaboração do OpenAI, está centrada em Helix, um modelo “generalista” de ação de visão (VLA).
Os VLAs são um novo fenômeno para robótica, alavancando os comandos da visão e da linguagem para processar informações. Atualmente, o exemplo mais conhecido da categoria é o RT-2 do Google DeepMind, que treina robôs através de uma combinação de vídeo e modelos de idiomas grandes (LLMS).
A Helix trabalha de maneira semelhante, combinando dados visuais e instruções de linguagem para controlar um robô em tempo real. A Figura escreve: “A hélice exibe forte generalização de objetos, sendo capaz de captar milhares de novos itens domésticos com formas, tamanhos, cores e propriedades materiais variados nunca encontrados antes no treinamento, simplesmente perguntando em linguagem natural”.

Em um mundo ideal, você pode simplesmente dizer a um robô para fazer alguma coisa e isso faria isso. É aí que entra Helix, de acordo com a figura. A plataforma foi projetada para preencher a lacuna entre a visão e o processamento da linguagem. Depois de receber um prompt de voz de linguagem natural, o robô avalia visualmente seu ambiente e depois executa a tarefa.
A Figura oferece exemplos como: “Mão o saco de biscoitos ao robô à sua direita” ou “Receba o saco de biscoitos do robô à sua esquerda e coloque -o na gaveta aberta”. Ambos os exemplos envolvem um par de robôs trabalhando juntos. Isso ocorre porque a Helix foi projetada para controlar dois robôs ao mesmo tempo, com um ajudando o outro a executar várias tarefas domésticas.
A figura está mostrando o VLM destacando o trabalho que a empresa tem feito com seu 02 Robô Humanóide no ambiente doméstico. As casas são notoriamente complicadas para os robôs, já que não têm a estrutura e a consistência de armazéns e fábricas.
A dificuldade com o aprendizado e o controle são grandes obstáculos entre sistemas de robôs complexos e o lar. Essas questões, juntamente com os preços de cinco a seis dígitos, são o motivo pelo qual o robô doméstico não tem precedência para a maioria das empresas de robótica humanóide. De um modo geral, a abordagem é construir robôs para clientes industriais, melhorando a confiabilidade e reduzindo os custos antes de combater as habitações. O trabalho doméstico é uma conversa daqui a alguns anos.
Quando o Strong The One visitou os escritórios da Bay Area da Figura em 2024, Adcock mostrou alguns ritmos que a empresa estava colocando seu humanóide no ambiente doméstico. Parecia na época que o trabalho não estava sendo priorizado, pois a Figura se concentra nos pilotos do local de trabalho com empresas como a BMW.

Com o anúncio da hélice de quinta -feira, a Figura está deixando claro que a casa deve ser uma prioridade por si só. É um cenário desafiador e complexo para testar esses tipos de modelos de treinamento. Ensinar robôs a realizar tarefas complexas na cozinha – por exemplo – abre -as para uma ampla gama de ações em diferentes configurações.
“Para que os robôs sejam úteis nas famílias, eles precisarão ser capazes de gerar novos comportamentos inteligentes sob demanda, especialmente para objetos que nunca viram antes”, diz Figura. “Ensinar robôs até mesmo um novo comportamento requer um esforço humano substancial: horas de programação manual de especialistas em nível de doutorado ou milhares de demonstrações”.
A programação manual não é escalada para a casa. Existem simplesmente muitas incógnitas. Cozinhas, salas de estar e banheiros variam dramaticamente de uma para a outra. O mesmo pode ser dito para as ferramentas usadas para cozinhar e limpar. Além disso, as pessoas deixam bagunças, reorganizam os móveis e preferem uma variedade de diferentes iluminação ambiental. Esse método leva muito tempo e dinheiro – embora a figura certamente tenha bastante.
A outra opção é o treinamento – e muito. Os braços robóticos treinados para escolher e colocar objetos em laboratórios geralmente usam esse método. O que você não vê é que as centenas de horas de repetição são tomadas para fazer uma demonstração robusta o suficiente para assumir tarefas altamente variáveis. Para entender algo da primeira vez, um robô precisa ter feito centenas de vezes no passado.
Como tanta robótica humanóide circundante no momento, o trabalho na helix ainda está em um estágio muito inicial. Os espectadores devem ser avisados de que muito trabalho acontece nos bastidores para criar os tipos de vídeos curtos e bem produzidos vistos neste post. O anúncio de hoje é, em essência, uma ferramenta de recrutamento projetada para trazer mais engenheiros a bordo para ajudar a aumentar o projeto.
.