NVIDIA revela plataforma de IA “Vera Rubin” no GTC 2026 e acelera a era das fábricas de inteligência artificial

Durante o GTC 2026, a conferência anual da NVIDIA voltada para inteligência artificial e computação acelerada, o fundador e CEO Jensen Huang apresentou oficialmente a nova geração de plataforma de IA da empresa: Vera Rubin. O nome homenageia a astrônoma Vera Rubin, conhecida por descobrir evidências da existência da matéria escura.
Mais do que um novo chip, a plataforma representa um passo importante na transformação da NVIDIA — de fabricante de GPUs para fornecedora completa de infraestrutura para fábricas de IA.
Um salto tecnológico em relação à geração Blackwell
A GPU Rubin foi construída usando o processo avançado de 3 nanômetros da TSMC e integra aproximadamente 336 bilhões de transistores. Em comparação com a arquitetura anterior Blackwell, o novo design oferece mais de 60% de aumento em capacidade tecnológica.
Esse avanço não se limita apenas à potência bruta. A arquitetura Rubin foi projetada para lidar com as demandas crescentes de modelos multimodais e modelos de especialistas mistos (MoE), que exigem enorme capacidade de processamento e memória.
O conceito de “seis chips trabalhando juntos”
Uma das novidades mais importantes da plataforma Rubin é o modelo de computação baseado em cooperação entre seis chips, redefinindo o padrão para supercomputadores de IA.
O chamado superchip Rubin combina:
- 1 CPU Vera
- 2 GPUs Rubin
- 288 GB de memória HBM4
- Largura de banda de até 22 TB/s
Essa combinação permite que sistemas de IA operem com volumes massivos de dados e modelos muito maiores do que antes.
Desempenho até 5 vezes maior em inferência
Em termos de performance, a Rubin impressiona:
- 50 PFLOPS de desempenho FP4 em inferência
- 5× mais performance que Blackwell
- Até 10× mais eficiência energética por watt
Isso significa que tarefas complexas de IA — como inferência em modelos gigantes e treinamento de modelos MoE — poderão ser realizadas com menos custo energético e maior velocidade.
Próximo passo: Rubin Ultra em 2027
Durante o evento, Jensen Huang também revelou os planos para a próxima evolução da arquitetura: Rubin Ultra, prevista para 2027.
Com uma configuração chamada NVL576, espera-se que o sistema alcance 15 ExaFLOPS de poder de inferência, abrindo caminho para aplicações de IA em escala nunca vista.
Produção em andamento e primeiros clientes
A NVIDIA confirmou que a plataforma Vera Rubin já entrou em produção.
Os primeiros sistemas devem começar a ser entregues no segundo semestre de 2026 para grandes empresas de nuvem, incluindo:
- AWS
- Google Cloud
- Microsoft Azure
Essas empresas serão responsáveis por operar os primeiros grandes clusters baseados na nova arquitetura.
Um mercado de trilhões de dólares
Segundo a NVIDIA, os pedidos combinados das arquiteturas Blackwell e Rubin já alcançam US$ 1 trilhão em demanda potencial, o dobro das previsões anteriores.
Ao mesmo tempo, a empresa está expandindo seu ecossistema com novas iniciativas, como:
- OpenClaw, um framework aberto para agentes de IA
- Integração de ativos da Groq, trazendo novas soluções baseadas em LPUs
A estratégia: uma nova geração por ano
A NVIDIA deixou claro que pretende manter um ritmo agressivo de inovação, com novas arquiteturas sendo lançadas praticamente todos os anos.
O objetivo é construir uma infraestrutura global capaz de suportar a próxima era da inteligência artificial, que inclui:
- Mega data centers de IA
- supercomputadores especializados
- robótica e IA física
- centros de dados em órbita no espaço
Com a plataforma Vera Rubin, a NVIDIA dá mais um passo rumo a um futuro onde a IA será alimentada por verdadeiras fábricas de computação inteligente em escala planetária. 🚀