A SenseTime anunciou oficialmente, em 29 de janeiro de 2026, a abertura do código do seu novo modelo de IA multimodal com raciocínio autônomo, o SenseNova-MARS, disponibilizando duas versões: 8B e 32B. O lançamento representa um passo importante na evolução dos grandes modelos multimodais, especialmente no campo do raciocínio visual avançado.

Um avanço técnico inédito: o primeiro Agentic VLM
O SenseNova-MARS traz uma arquitetura inovadora e se destaca como o primeiro Agentic VLM (Visual Language Model com comportamento de agente) do setor. Isso significa que o modelo vai além da simples interpretação de imagens e textos.
Entre seus principais diferenciais estão:
- Raciocínio visual dinâmico: o modelo consegue analisar imagens de forma ativa, ajustando sua lógica conforme o contexto.
- Capacidade autônoma de planejamento: atua como um agente inteligente, tomando decisões e estruturando etapas de raciocínio por conta própria.
- Integração profunda com busca em texto e imagem: ao combinar compreensão visual com acesso a informações externas via internet, o modelo resolve tarefas visuais complexas que exigem conhecimento adicional.
Raciocínio autônomo aplicado ao mundo real
Diferente dos modelos tradicionais, o SenseNova-MARS não apenas “entende” o que vê. Ele é capaz de:
- Interpretar cenários visuais complexos
- Buscar informações relevantes em tempo real
- Cruzar dados visuais e textuais
- Gerar conclusões mais precisas e contextualizadas
Isso amplia significativamente seu potencial de uso em áreas como análise industrial, cidades inteligentes, educação, saúde e aplicações corporativas avançadas.
Duas versões abertas para diferentes necessidades
Ao optar por um lançamento open source em dois tamanhos, a SenseTime busca atender perfis variados de desenvolvedores e empresas:
-
Versão 8B
Ideal para ambientes com recursos computacionais limitados ou dispositivos de borda (edge). Oferece um bom equilíbrio entre desempenho e eficiência. -
Versão 32B
Focada em aplicações mais complexas, com maior capacidade de raciocínio lógico e análise profunda, atendendo demandas industriais e corporativas de alto nível.
Impacto para a comunidade global
A abertura do SenseNova-MARS fortalece o ecossistema de pesquisa e desenvolvimento em IA multimodal, oferecendo ferramentas mais flexíveis e poderosas para inovação. Para desenvolvedores, pesquisadores e empresas, o modelo representa uma nova geração de sistemas capazes de ver, pensar, buscar informações na internet e decidir de forma integrada.
Com esse lançamento, a SenseTime reforça seu papel de destaque na próxima fase da inteligência artificial: modelos que raciocinam de forma ativa e colaboram de maneira mais próxima com o mundo real.