LingBot-VLA: modelo open source do Ant Group impulsiona a inteligência incorporada com alto desempenho e baixo custo

A empresa de inteligência incorporada Lingbo Technology, ligada ao Ant Group, anunciou recentemente a abertura oficial do código do seu grande modelo de inteligência incorporada, o LingBot-VLA. O modelo não só apresenta desempenho excepcional em diversos benchmarks de referência, como também disponibiliza todo o código de pós-treinamento, com o objetivo de reduzir significativamente a barreira de entrada no desenvolvimento de inteligência incorporada.

Desempenho: generalização multiplataforma e controle preciso
O LingBot-VLA demonstrou alta precisão e forte capacidade de generalização tanto em ambientes reais quanto em cenários simulados:

Avaliação em cenários reais: No benchmark GM-100 da Universidade Jiao Tong de Xangai, o LingBot-VLA alcançou uma taxa média de sucesso de 15,7% em generalização entre diferentes robôs, em três plataformas distintas, superando o Pi0.5, que obteve 13,0%.
Percepção espacial aprimorada: Com a introdução de informações de profundidade, a taxa média de sucesso aumentou ainda mais, chegando a 17,3%.
Liderança em ambientes simulados: Na avaliação de simulação RoboTwin 2.0, enfrentando interferências aleatórias como variações de iluminação e presença de objetos diversos, a taxa de sucesso operacional foi 9,92% maior do que a do Pi0.5.

Núcleo técnico: cadeia de ferramentas de pós-treinamento altamente eficiente
As vantagens do LingBot-VLA vão além do desempenho, destacando-se também pela eficiência de treinamento e capacidade de transferência:

Transferência de baixo custo: Graças ao pré-treinamento em larga escala, o modelo consegue superar modelos mainstream em tarefas downstream utilizando uma quantidade significativamente menor de dados.
Treinamento de alto throughput: A equipe desenvolveu uma cadeia de ferramentas altamente eficiente que, em uma configuração com 8 GPUs, alcança 261 amostras por segundo por GPU. Essa eficiência é de 1,5 a 2,8 vezes superior a frameworks populares como StarVLA e OpenPI.

Conteúdo open source: todos os recursos disponíveis em um só lugar
A iniciativa de código aberto da Lingbo Technology é bastante abrangente, oferecendo suporte completo de ponta a ponta:

Pesos do modelo: Já disponíveis simultaneamente no Hugging Face e na comunidade ModelScope.
Repositório de código: O GitHub foi aberto com todo o conjunto de códigos, incluindo processamento de dados, fine-tuning eficiente e avaliação automatizada.
Conjuntos de dados e relatórios: Também foram disponibilizados o dataset GM-100 e um relatório técnico detalhado.

Com essa abertura completa, o LingBot-VLA oferece aos desenvolvedores de robótica uma opção de modelo VLA realmente prática, eficiente e de baixo custo, com grande potencial para acelerar a transição da inteligência incorporada do laboratório para aplicações reais em larga escala.

Leave a Comment Cancel Reply