SenseTime abre o código do SenseNova-MARS, primeiro modelo multimodal agentic com raciocínio autônomo

A SenseTime anunciou oficialmente, em 29 de janeiro de 2026, a abertura do código do seu novo modelo de IA multimodal com raciocínio autônomo, o SenseNova-MARS, disponibilizando duas versões: 8B e 32B. O lançamento representa um passo importante na evolução dos grandes modelos multimodais, especialmente no campo do raciocínio visual avançado.

SenseTime abre o código do SenseNova-MARS, primeiro modelo multimodal agentic com raciocínio autônomo

Um avanço técnico inédito: o primeiro Agentic VLM

O SenseNova-MARS traz uma arquitetura inovadora e se destaca como o primeiro Agentic VLM (Visual Language Model com comportamento de agente) do setor. Isso significa que o modelo vai além da simples interpretação de imagens e textos.

Entre seus principais diferenciais estão:

  • Raciocínio visual dinâmico: o modelo consegue analisar imagens de forma ativa, ajustando sua lógica conforme o contexto.
  • Capacidade autônoma de planejamento: atua como um agente inteligente, tomando decisões e estruturando etapas de raciocínio por conta própria.
  • Integração profunda com busca em texto e imagem: ao combinar compreensão visual com acesso a informações externas via internet, o modelo resolve tarefas visuais complexas que exigem conhecimento adicional.

Raciocínio autônomo aplicado ao mundo real

Diferente dos modelos tradicionais, o SenseNova-MARS não apenas “entende” o que vê. Ele é capaz de:

  • Interpretar cenários visuais complexos
  • Buscar informações relevantes em tempo real
  • Cruzar dados visuais e textuais
  • Gerar conclusões mais precisas e contextualizadas

Isso amplia significativamente seu potencial de uso em áreas como análise industrial, cidades inteligentes, educação, saúde e aplicações corporativas avançadas.

Duas versões abertas para diferentes necessidades

Ao optar por um lançamento open source em dois tamanhos, a SenseTime busca atender perfis variados de desenvolvedores e empresas:

  • Versão 8B
    Ideal para ambientes com recursos computacionais limitados ou dispositivos de borda (edge). Oferece um bom equilíbrio entre desempenho e eficiência.

  • Versão 32B
    Focada em aplicações mais complexas, com maior capacidade de raciocínio lógico e análise profunda, atendendo demandas industriais e corporativas de alto nível.

Impacto para a comunidade global

A abertura do SenseNova-MARS fortalece o ecossistema de pesquisa e desenvolvimento em IA multimodal, oferecendo ferramentas mais flexíveis e poderosas para inovação. Para desenvolvedores, pesquisadores e empresas, o modelo representa uma nova geração de sistemas capazes de ver, pensar, buscar informações na internet e decidir de forma integrada.

Com esse lançamento, a SenseTime reforça seu papel de destaque na próxima fase da inteligência artificial: modelos que raciocinam de forma ativa e colaboram de maneira mais próxima com o mundo real.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top