LongCat-Flash-Prover: o modelo open source que leva a IA a provar teoremas com rigor matemático

Em 24 de março de 2026, a equipe LongCat, da Meituan, anunciou o lançamento open source de um novo modelo de inteligência artificial voltado para matemática formal e prova de teoremas: o LongCat-Flash-Prover. A proposta do modelo é enfrentar uma das principais limitações dos grandes modelos de linguagem atuais — a dificuldade em realizar raciocínios rigorosos e logicamente verificáveis.

LongCat-Flash-Prover: o modelo open source que leva a IA a provar teoremas com rigor matemático

Uma nova forma de raciocinar com IA

Diferente dos modelos tradicionais, que funcionam com base em previsões probabilísticas de texto, o LongCat-Flash-Prover introduz uma abordagem mais estruturada. Ele divide o processo de resolução matemática em três etapas fundamentais:

  • Autoformalização (Auto-Formalization): traduz problemas matemáticos em linguagem formal
  • Esboço (Sketching): cria uma estrutura inicial da solução
  • Prova (Proving): desenvolve a demonstração completa com rigor lógico

Esse fluxo permite que a IA vá além de “sugerir respostas” e passe a construir provas matemáticas verificáveis, aproximando-se do método utilizado por pesquisadores humanos.

Resultados impressionantes

Com o uso da estratégia chamada Tool-Integrated Reasoning (TIR) — que integra ferramentas externas no processo de raciocínio — o modelo alcançou resultados de destaque:

  • 97,1% de taxa de acerto no MiniF2F-Test, utilizando apenas 72 etapas de inferência
  • Superou outros modelos open source em benchmarks avançados como MathOlympiad-Bench e PutnamBench

Esses números colocam o LongCat-Flash-Prover como o novo estado da arte (SOTA) entre modelos de prova matemática abertos.

Arquitetura e inovação técnica

O modelo utiliza um framework chamado “mistura de especialistas iterativa” (MoE + TIR), que combina diferentes módulos especializados ao longo do processo de raciocínio. Entre os principais diferenciais técnicos estão:

  • Integração com o Lean4Server para verificação formal das provas
  • Checagem de consistência semântica e lógica dos teoremas
  • Sistema de validação contra 9 tipos de comportamentos indevidos (cheating)

Durante o treinamento, foram aplicadas técnicas avançadas como:

  • Masking hierárquico, que melhora a generalização
  • Controle de staleness em nível de token, aumentando a estabilidade do aprendizado por reforço em arquiteturas MoE

Impacto no futuro da pesquisa científica

O avanço representado pelo LongCat-Flash-Prover vai além de benchmarks. Ele marca uma mudança importante: a transição da IA de sistemas que “interpretam linguagem” para sistemas que produzem conhecimento matemático verificável por computador.

Isso abre caminho para aplicações como:

  • Verificação automática de artigos científicos
  • Apoio à pesquisa em matemática avançada
  • Descoberta assistida de novos teoremas

Na prática, modelos desse tipo podem se tornar uma infraestrutura essencial para a ciência, ajudando pesquisadores a validar resultados com mais rapidez e segurança.

Acesse o projeto


O LongCat-Flash-Prover representa um passo importante rumo a uma IA mais confiável e útil para áreas que exigem precisão absoluta. Estamos entrando em uma nova fase, onde a inteligência artificial não apenas responde — mas prova.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top