Nos últimos dias, um experimento chamou a atenção do mundo da tecnologia — e levanta uma pergunta importante: afinal, qual é o limite de poder de um smartphone?

A Apple, com seu mais novo flagship, o iPhone 17 Pro, acabou de dar uma resposta surpreendente — e um pouco desconfortável também.
📱 Um feito impressionante… mas com ressalvas
No dia 23 de março, um modelo de linguagem com 400 bilhões de parâmetros foi executado com sucesso diretamente no iPhone 17 Pro.
Para ter ideia da magnitude disso: mesmo com compressão e otimizações, esse tipo de modelo normalmente exige cerca de 200 GB de memória para funcionar. Já o iPhone conta com apenas 12 GB de RAM (LPDDR5X).
Então, como isso foi possível?
⚙️ As “gambiarras” inteligentes por trás da façanha
Dois avanços técnicos foram fundamentais para tornar esse “impossível” em realidade:
1. Uso do armazenamento como extensão da memória
Com o projeto open-source Flash-MoE, o sistema consegue transferir dados diretamente do armazenamento interno (SSD) para a GPU em tempo real.
Na prática, isso “simula” uma memória muito maior do que a disponível fisicamente.
2. Arquitetura MoE (Mixture of Experts)
Ao invés de usar todos os 400 bilhões de parâmetros ao mesmo tempo, o modelo ativa apenas uma pequena parte deles a cada palavra gerada.
Isso reduz drasticamente o consumo de recursos — tornando viável rodar algo tão grande em um dispositivo tão limitado.
🐢 O problema: desempenho ainda é muito lento
Apesar de “funcionar”, o resultado ainda está longe de ser prático.
- Velocidade: cerca de 0,6 token por segundo
- Isso significa que o sistema leva entre 1,5 e 2 segundos para gerar uma única palavra
Além disso:
- 🔋 Consumo de bateria é altíssimo
- 🔥 O aquecimento do aparelho é significativo
Ou seja, é mais uma prova de conceito do que algo utilizável no dia a dia.
🚀 O que isso significa para o futuro?
Mesmo com limitações claras, esse experimento aponta para um futuro muito interessante.
🔒 Mais privacidade
Rodar modelos diretamente no celular elimina a necessidade de enviar dados para a nuvem — um grande avanço em segurança e privacidade.
📶 Uso offline
Imagine ter acesso a uma IA poderosa mesmo sem internet. Isso começa a se tornar possível.
🧠 O nascimento do “super cérebro de bolso”
Especialistas dizem que há uma grande diferença entre:
- “conseguir rodar”
- e “rodar bem”
Mas a tendência é clara.
Se hoje temos 0,6 token por segundo, não é difícil imaginar que, com evolução de hardware e software, isso possa chegar a 60 tokens por segundo nos próximos anos.
Quando isso acontecer, o smartphone deixará de ser apenas um dispositivo inteligente — e se tornará um verdadeiro supercomputador pessoal no seu bolso.
O que hoje parece lento e experimental pode ser o primeiro passo de uma revolução silenciosa.