{"id":2888,"date":"2026-03-24T04:12:15","date_gmt":"2026-03-24T04:12:15","guid":{"rendered":"https:\/\/hizhongguo.com\/index.php\/2026\/03\/24\/iphone-17-pro-roda-ia-de-400-bilhoes-de-parametros-e-mostra-o-inicio-do-supercomputador-no-bolso\/"},"modified":"2026-03-24T04:12:15","modified_gmt":"2026-03-24T04:12:15","slug":"iphone-17-pro-roda-ia-de-400-bilhoes-de-parametros-e-mostra-o-inicio-do-supercomputador-no-bolso","status":"publish","type":"post","link":"https:\/\/hizhongguo.com\/index.php\/2026\/03\/24\/iphone-17-pro-roda-ia-de-400-bilhoes-de-parametros-e-mostra-o-inicio-do-supercomputador-no-bolso\/","title":{"rendered":"iPhone 17 Pro roda IA de 400 bilh\u00f5es de par\u00e2metros e mostra o in\u00edcio do supercomputador no bolso"},"content":{"rendered":"<p>Nos \u00faltimos dias, um experimento chamou a aten\u00e7\u00e3o do mundo da tecnologia \u2014 e levanta uma pergunta importante: afinal, qual \u00e9 o limite de poder de um smartphone?<\/p>\n<figure id=\"attachment_mmd_2887\" class=\"wp-block-image \"><img decoding=\"async\" width=\"1024\" height=\"1536\" src=\"https:\/\/hizhongguo.com\/wp-content\/uploads\/2026\/03\/cover-546.webp\" class=\"attachment-full size-full\" alt=\"iPhone 17 Pro roda IA de 400 bilh\u00f5es de par\u00e2metros e mostra o in\u00edcio do supercomputador no bolso\" loading=\"lazy\" \/><\/figure>\n<p>A Apple, com seu mais novo flagship, o iPhone 17 Pro, acabou de dar uma resposta surpreendente \u2014 e um pouco desconfort\u00e1vel tamb\u00e9m.<\/p>\n<hr \/>\n<h2>\ud83d\udcf1 Um feito impressionante\u2026 mas com ressalvas<\/h2>\n<p>No dia 23 de mar\u00e7o, um modelo de linguagem com <strong>400 bilh\u00f5es de par\u00e2metros<\/strong> foi executado com sucesso diretamente no iPhone 17 Pro.<\/p>\n<p>Para ter ideia da magnitude disso: mesmo com compress\u00e3o e otimiza\u00e7\u00f5es, esse tipo de modelo normalmente exige <strong>cerca de 200 GB de mem\u00f3ria<\/strong> para funcionar. J\u00e1 o iPhone conta com apenas <strong>12 GB de RAM (LPDDR5X)<\/strong>.<\/p>\n<p>Ent\u00e3o, como isso foi poss\u00edvel?<\/p>\n<hr \/>\n<h2>\u2699\ufe0f As \u201cgambiarras\u201d inteligentes por tr\u00e1s da fa\u00e7anha<\/h2>\n<p>Dois avan\u00e7os t\u00e9cnicos foram fundamentais para tornar esse \u201cimposs\u00edvel\u201d em realidade:<\/p>\n<h3>1. Uso do armazenamento como extens\u00e3o da mem\u00f3ria<\/h3>\n<p>Com o projeto open-source <strong>Flash-MoE<\/strong>, o sistema consegue transferir dados diretamente do armazenamento interno (SSD) para a GPU em tempo real.<\/p>\n<p>Na pr\u00e1tica, isso \u201csimula\u201d uma mem\u00f3ria muito maior do que a dispon\u00edvel fisicamente.<\/p>\n<h3>2. Arquitetura MoE (Mixture of Experts)<\/h3>\n<p>Ao inv\u00e9s de usar todos os 400 bilh\u00f5es de par\u00e2metros ao mesmo tempo, o modelo ativa apenas uma pequena parte deles a cada palavra gerada.<\/p>\n<p>Isso reduz drasticamente o consumo de recursos \u2014 tornando vi\u00e1vel rodar algo t\u00e3o grande em um dispositivo t\u00e3o limitado.<\/p>\n<hr \/>\n<h2>\ud83d\udc22 O problema: desempenho ainda \u00e9 muito lento<\/h2>\n<p>Apesar de \u201cfuncionar\u201d, o resultado ainda est\u00e1 longe de ser pr\u00e1tico.<\/p>\n<ul>\n<li><strong>Velocidade:<\/strong> cerca de <strong>0,6 token por segundo<\/strong><\/li>\n<li>Isso significa que o sistema leva <strong>entre 1,5 e 2 segundos para gerar uma \u00fanica palavra<\/strong><\/li>\n<\/ul>\n<p>Al\u00e9m disso:<\/p>\n<ul>\n<li>\ud83d\udd0b <strong>Consumo de bateria \u00e9 alt\u00edssimo<\/strong><\/li>\n<li>\ud83d\udd25 <strong>O aquecimento do aparelho \u00e9 significativo<\/strong><\/li>\n<\/ul>\n<p>Ou seja, \u00e9 mais uma prova de conceito do que algo utiliz\u00e1vel no dia a dia.<\/p>\n<hr \/>\n<h2>\ud83d\ude80 O que isso significa para o futuro?<\/h2>\n<p>Mesmo com limita\u00e7\u00f5es claras, esse experimento aponta para um futuro muito interessante.<\/p>\n<h3>\ud83d\udd12 Mais privacidade<\/h3>\n<p>Rodar modelos diretamente no celular elimina a necessidade de enviar dados para a nuvem \u2014 um grande avan\u00e7o em seguran\u00e7a e privacidade.<\/p>\n<h3>\ud83d\udcf6 Uso offline<\/h3>\n<p>Imagine ter acesso a uma IA poderosa mesmo sem internet. Isso come\u00e7a a se tornar poss\u00edvel.<\/p>\n<hr \/>\n<h2>\ud83e\udde0 O nascimento do \u201csuper c\u00e9rebro de bolso\u201d<\/h2>\n<p>Especialistas dizem que h\u00e1 uma grande diferen\u00e7a entre:<\/p>\n<ul>\n<li>\u201cconseguir rodar\u201d<\/li>\n<li>e \u201crodar bem\u201d<\/li>\n<\/ul>\n<p>Mas a tend\u00eancia \u00e9 clara.<\/p>\n<p>Se hoje temos <strong>0,6 token por segundo<\/strong>, n\u00e3o \u00e9 dif\u00edcil imaginar que, com evolu\u00e7\u00e3o de hardware e software, isso possa chegar a <strong>60 tokens por segundo<\/strong> nos pr\u00f3ximos anos.<\/p>\n<p>Quando isso acontecer, o smartphone deixar\u00e1 de ser apenas um dispositivo inteligente \u2014 e se tornar\u00e1 um verdadeiro <strong>supercomputador pessoal no seu bolso<\/strong>.<\/p>\n<hr \/>\n<p>O que hoje parece lento e experimental pode ser o primeiro passo de uma revolu\u00e7\u00e3o silenciosa.<\/p>","protected":false},"excerpt":{"rendered":"<p>Nos \u00faltimos dias, um experimento chamou a aten\u00e7\u00e3o do mundo da tecnologia \u2014 e levanta uma pergunta importante: afinal, qual [&hellip;]<\/p>","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[1],"tags":[],"class_list":["post-2888","post","type-post","status-publish","format-standard","hentry","category-ai-news"],"_links":{"self":[{"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/posts\/2888","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/comments?post=2888"}],"version-history":[{"count":0,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/posts\/2888\/revisions"}],"wp:attachment":[{"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/media?parent=2888"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/categories?post=2888"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/tags?post=2888"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}