Em 24 de março de 2026, a equipe LongCat, da Meituan, anunciou o lançamento open source de um novo modelo de inteligência artificial voltado para matemática formal e prova de teoremas: o LongCat-Flash-Prover. A proposta do modelo é enfrentar uma das principais limitações dos grandes modelos de linguagem atuais — a dificuldade em realizar raciocínios rigorosos e logicamente verificáveis.

Uma nova forma de raciocinar com IA
Diferente dos modelos tradicionais, que funcionam com base em previsões probabilísticas de texto, o LongCat-Flash-Prover introduz uma abordagem mais estruturada. Ele divide o processo de resolução matemática em três etapas fundamentais:
- Autoformalização (Auto-Formalization): traduz problemas matemáticos em linguagem formal
- Esboço (Sketching): cria uma estrutura inicial da solução
- Prova (Proving): desenvolve a demonstração completa com rigor lógico
Esse fluxo permite que a IA vá além de “sugerir respostas” e passe a construir provas matemáticas verificáveis, aproximando-se do método utilizado por pesquisadores humanos.
Resultados impressionantes
Com o uso da estratégia chamada Tool-Integrated Reasoning (TIR) — que integra ferramentas externas no processo de raciocínio — o modelo alcançou resultados de destaque:
- 97,1% de taxa de acerto no MiniF2F-Test, utilizando apenas 72 etapas de inferência
- Superou outros modelos open source em benchmarks avançados como MathOlympiad-Bench e PutnamBench
Esses números colocam o LongCat-Flash-Prover como o novo estado da arte (SOTA) entre modelos de prova matemática abertos.
Arquitetura e inovação técnica
O modelo utiliza um framework chamado “mistura de especialistas iterativa” (MoE + TIR), que combina diferentes módulos especializados ao longo do processo de raciocínio. Entre os principais diferenciais técnicos estão:
- Integração com o Lean4Server para verificação formal das provas
- Checagem de consistência semântica e lógica dos teoremas
- Sistema de validação contra 9 tipos de comportamentos indevidos (cheating)
Durante o treinamento, foram aplicadas técnicas avançadas como:
- Masking hierárquico, que melhora a generalização
- Controle de staleness em nível de token, aumentando a estabilidade do aprendizado por reforço em arquiteturas MoE
Impacto no futuro da pesquisa científica
O avanço representado pelo LongCat-Flash-Prover vai além de benchmarks. Ele marca uma mudança importante: a transição da IA de sistemas que “interpretam linguagem” para sistemas que produzem conhecimento matemático verificável por computador.
Isso abre caminho para aplicações como:
- Verificação automática de artigos científicos
- Apoio à pesquisa em matemática avançada
- Descoberta assistida de novos teoremas
Na prática, modelos desse tipo podem se tornar uma infraestrutura essencial para a ciência, ajudando pesquisadores a validar resultados com mais rapidez e segurança.
Acesse o projeto
- GitHub: https://github.com/meituan-longcat/LongCat-Flash-Prover
- Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Flash-Prover
- Relatório técnico:
https://github.com/meituan-longcat/LongCat-Flash-Prover/blob/main/LongCat_Flash_Prover_Technical_Report.pdf
O LongCat-Flash-Prover representa um passo importante rumo a uma IA mais confiável e útil para áreas que exigem precisão absoluta. Estamos entrando em uma nova fase, onde a inteligência artificial não apenas responde — mas prova.