iPhone 17 Pro roda IA de 400 bilhões de parâmetros e mostra o início do supercomputador no bolso

Nos últimos dias, um experimento chamou a atenção do mundo da tecnologia — e levanta uma pergunta importante: afinal, qual é o limite de poder de um smartphone?

A Apple, com seu mais novo flagship, o iPhone 17 Pro, acabou de dar uma resposta surpreendente — e um pouco desconfortável também.

📱 Um feito impressionante… mas com ressalvas

No dia 23 de março, um modelo de linguagem com 400 bilhões de parâmetros foi executado com sucesso diretamente no iPhone 17 Pro.

Para ter ideia da magnitude disso: mesmo com compressão e otimizações, esse tipo de modelo normalmente exige cerca de 200 GB de memória para funcionar. Já o iPhone conta com apenas 12 GB de RAM (LPDDR5X).

Então, como isso foi possível?

⚙️ As “gambiarras” inteligentes por trás da façanha

Dois avanços técnicos foram fundamentais para tornar esse “impossível” em realidade:

1. Uso do armazenamento como extensão da memória

Com o projeto open-source Flash-MoE, o sistema consegue transferir dados diretamente do armazenamento interno (SSD) para a GPU em tempo real.

Na prática, isso “simula” uma memória muito maior do que a disponível fisicamente.

2. Arquitetura MoE (Mixture of Experts)

Ao invés de usar todos os 400 bilhões de parâmetros ao mesmo tempo, o modelo ativa apenas uma pequena parte deles a cada palavra gerada.

Isso reduz drasticamente o consumo de recursos — tornando viável rodar algo tão grande em um dispositivo tão limitado.

🐢 O problema: desempenho ainda é muito lento

Apesar de “funcionar”, o resultado ainda está longe de ser prático.

Velocidade: cerca de 0,6 token por segundo
Isso significa que o sistema leva entre 1,5 e 2 segundos para gerar uma única palavra

Além disso:

🔋 Consumo de bateria é altíssimo
🔥 O aquecimento do aparelho é significativo

Ou seja, é mais uma prova de conceito do que algo utilizável no dia a dia.

🚀 O que isso significa para o futuro?

Mesmo com limitações claras, esse experimento aponta para um futuro muito interessante.

🔒 Mais privacidade

Rodar modelos diretamente no celular elimina a necessidade de enviar dados para a nuvem — um grande avanço em segurança e privacidade.

📶 Uso offline

Imagine ter acesso a uma IA poderosa mesmo sem internet. Isso começa a se tornar possível.

🧠 O nascimento do “super cérebro de bolso”

Especialistas dizem que há uma grande diferença entre:

“conseguir rodar”
e “rodar bem”

Mas a tendência é clara.

Se hoje temos 0,6 token por segundo, não é difícil imaginar que, com evolução de hardware e software, isso possa chegar a 60 tokens por segundo nos próximos anos.

Quando isso acontecer, o smartphone deixará de ser apenas um dispositivo inteligente — e se tornará um verdadeiro supercomputador pessoal no seu bolso.

O que hoje parece lento e experimental pode ser o primeiro passo de uma revolução silenciosa.