O SuperCLUE lançou oficialmente o Relatório Anual de Benchmark de Grandes Modelos de Linguagem em Chinês 2025, uma verdadeira “liga dos campeões” da inteligência artificial, reunindo 23 modelos de ponta, nacionais e internacionais. O estudo trouxe uma visão clara e comparável do desempenho real desses modelos em cenários de uso avançado.

Como foi a avaliação?
Os testes abrangeram seis dimensões centrais, incluindo:
- Raciocínio matemático
- Geração de código
- Raciocínio científico
- Compreensão lógica
- Capacidade geral de análise
- Robustez em contexto em língua chinesa
O objetivo foi medir, de forma prática, a “força real” de cada modelo no uso cotidiano.
Ranking geral: gigantes globais ainda lideram
No ranking consolidado, os modelos fechados internacionais continuam demonstrando grande vantagem:
🥇 Claude-Opus-4.5-Reasoning (Anthropic) ficou em 1º lugar, com 68,25 pontos, destacando-se pela precisão lógica e compreensão profunda.
🥈 Gemini-3-Pro-Preview (Google) conquistou o 2º lugar.
🥉 GPT-5.2 (high) (OpenAI) garantiu a 3ª posição.
Esses três modelos formam o chamado “primeiro pelotão”, mantendo uma leve, porém consistente, liderança em raciocínio e entendimento global.
Modelos chineses aceleram e encurtam a distância
Apesar da liderança internacional, os modelos chineses surpreenderam positivamente, avançando em ritmo acelerado:
- Kimi-K2.5-Thinking, destaque entre os modelos open source, alcançou o 4º lugar global.
- Qwen3-Max-Thinking, representante dos modelos fechados chineses, ficou em 6º lugar.
O mais impressionante é que, em áreas específicas, os modelos chineses já ultrapassaram os líderes globais.
Destaque por áreas: superação pontual
🚀 Geração de código: o Kimi-K2.5-Thinking ficou em 1º lugar mundial, superando todos os concorrentes.
📐 Raciocínio matemático: o Qwen3-Max-Thinking empatou com o Gemini, dividindo o topo global.
Esses resultados mostram que a competição já não é apenas de “alcançar”, mas de liderar em nichos estratégicos.
Open source vs. fechado: cenários bem diferentes
O relatório também revelou um contraste claro:
- 🔒 Modelos fechados: liderança ainda está nas mãos de empresas internacionais, com os chineses em forte perseguição.
- 🌍 Modelos open source: os modelos chineses dominam amplamente, com o Top 5 nacional superando com folga os concorrentes estrangeiros.
Esse equilíbrio entre modelos fechados de alto desempenho e open source altamente competitivos indica que o ecossistema chinês de IA entrou em uma fase de crescimento acelerado e alta qualidade, impulsionada por colaboração aberta e inovação contínua.
Em resumo
🏆 Liderança internacional permanece, mas com vantagem cada vez menor.
🚀 Modelos chineses já lideram em tarefas-chave, como código e matemática.
📊 Open source chinês se destaca globalmente, consolidando um ecossistema forte, aberto e competitivo.
O cenário atual mostra que a batalha global da IA está longe de terminar — e a próxima virada pode acontecer mais cedo do que muitos imaginam.