{"id":2219,"date":"2026-03-11T03:24:11","date_gmt":"2026-03-11T03:24:11","guid":{"rendered":"https:\/\/hizhongguo.com\/index.php\/2026\/03\/11\/xiaomi-18-pode-trazer-botao-fisico-para-ia-chip-de-2-nm-e-camera-periscopio-mais-potente\/"},"modified":"2026-03-11T03:24:11","modified_gmt":"2026-03-11T03:24:11","slug":"xiaomi-18-pode-trazer-botao-fisico-para-ia-chip-de-2-nm-e-camera-periscopio-mais-potente","status":"publish","type":"post","link":"https:\/\/hizhongguo.com\/index.php\/2026\/03\/11\/xiaomi-18-pode-trazer-botao-fisico-para-ia-chip-de-2-nm-e-camera-periscopio-mais-potente\/","title":{"rendered":"Xiaomi 18 pode trazer bot\u00e3o f\u00edsico para IA, chip de 2 nm e c\u00e2mera perisc\u00f3pio mais potente"},"content":{"rendered":"<p>A Fish Audio anunciou oficialmente o lan\u00e7amento do seu novo modelo de <strong>texto-para-fala (TTS)<\/strong> de \u00faltima gera\u00e7\u00e3o, chamado <strong>S2<\/strong>, marcando um avan\u00e7o significativo na tecnologia de voz por IA de c\u00f3digo aberto. A novidade promete elevar o n\u00edvel de <strong>expressividade, controle emocional e naturalidade<\/strong> nas vozes geradas artificialmente.<\/p>\n<figure id=\"attachment_mmd_2218\" class=\"wp-block-image \"><img decoding=\"async\" width=\"1024\" height=\"1536\" src=\"https:\/\/hizhongguo.com\/wp-content\/uploads\/2026\/03\/cover-223.webp\" class=\"attachment-full size-full\" alt=\"Xiaomi 18 pode trazer bot\u00e3o f\u00edsico para IA, chip de 2 nm e c\u00e2mera perisc\u00f3pio mais potente\" loading=\"lazy\" \/><\/figure>\n<h2>Uma nova gera\u00e7\u00e3o de voz com intelig\u00eancia emocional<\/h2>\n<p>O <strong>Fish Audio S2<\/strong> foi projetado para permitir um controle muito mais detalhado sobre a forma como a voz \u00e9 gerada. Um dos grandes diferenciais \u00e9 a possibilidade de ajustar <strong>emo\u00e7\u00f5es, entona\u00e7\u00e3o e estilo de fala usando comandos em linguagem natural<\/strong> diretamente no texto.<\/p>\n<p>Por exemplo, o usu\u00e1rio pode inserir tags como:<\/p>\n<ul>\n<li><code>[laugh]<\/code> para risadas  <\/li>\n<li><code>[whispers]<\/code> para fala em sussurro  <\/li>\n<li><code>[super happy]<\/code> para um tom extremamente alegre  <\/li>\n<\/ul>\n<p>Tamb\u00e9m \u00e9 poss\u00edvel definir estilos mais espec\u00edficos, como:<\/p>\n<ul>\n<li><code>[professional broadcast tone]<\/code> para um tom profissional de locu\u00e7\u00e3o  <\/li>\n<li><code>[pitch up]<\/code> para aumentar o tom da voz  <\/li>\n<\/ul>\n<p>Esses comandos podem ser aplicados <strong>em palavras espec\u00edficas ou em trechos curtos<\/strong>, permitindo um n\u00edvel de controle extremamente preciso sobre o resultado final. O objetivo \u00e9 produzir vozes <strong>mais naturais, expressivas e pr\u00f3ximas da fala humana real<\/strong>.<\/p>\n<h2>Principais destaques do Fish Audio S2<\/h2>\n<h3>C\u00f3digo totalmente aberto<\/h3>\n<p>O projeto foi lan\u00e7ado de forma <strong>completamente open source<\/strong>. Isso inclui:<\/p>\n<ul>\n<li>Pesos do modelo  <\/li>\n<li>C\u00f3digo de treinamento e fine-tuning  <\/li>\n<li>Motor de infer\u00eancia em streaming baseado em <strong>SGLang<\/strong><\/li>\n<\/ul>\n<p>A vers\u00e3o mais avan\u00e7ada, chamada <strong>S2-Pro<\/strong>, conta com cerca de <strong>4,4 bilh\u00f5es de par\u00e2metros<\/strong>, sendo considerada o modelo flagship da linha.<\/p>\n<h3>Lat\u00eancia extremamente baixa<\/h3>\n<p>Outro destaque \u00e9 a velocidade. O modelo possui <strong>lat\u00eancia inferior a 150 ms<\/strong>, o que o torna ideal para aplica\u00e7\u00f5es em tempo real, como:<\/p>\n<ul>\n<li>Assistentes virtuais  <\/li>\n<li>Chatbots com voz  <\/li>\n<li>Avatares digitais  <\/li>\n<li>Streamers e apresentadores virtuais<\/li>\n<\/ul>\n<h3>Suporte nativo a m\u00faltiplos falantes<\/h3>\n<p>O S2 tamb\u00e9m oferece <strong>suporte nativo a m\u00faltiplos locutores em uma \u00fanica gera\u00e7\u00e3o de \u00e1udio<\/strong>. Isso significa que o sistema consegue:<\/p>\n<ul>\n<li>Alternar entre diferentes vozes em um di\u00e1logo  <\/li>\n<li>Simular conversas naturais  <\/li>\n<li>Permitir interrup\u00e7\u00f5es e mudan\u00e7as de turno  <\/li>\n<li>Manter consist\u00eancia de timbre e emo\u00e7\u00e3o<\/li>\n<\/ul>\n<p>Tudo isso <strong>sem necessidade de processamento adicional<\/strong>.<\/p>\n<h2>Treinado em escala massiva<\/h2>\n<p>Segundo a Fish Audio, o modelo foi treinado com cerca de <strong>10 milh\u00f5es de horas de \u00e1udio<\/strong>, cobrindo <strong>quase 50 idiomas<\/strong>.  <\/p>\n<p>A arquitetura combina:<\/p>\n<ul>\n<li><strong>Aprendizado por refor\u00e7o com alinhamento humano<\/strong><\/li>\n<li><strong>Arquitetura dual autoregressiva<\/strong><\/li>\n<\/ul>\n<p>Essa combina\u00e7\u00e3o permite que o sistema alcance <strong>altos n\u00edveis de naturalidade e expressividade<\/strong>, superando muitos modelos atuais tanto de c\u00f3digo aberto quanto propriet\u00e1rios em diversos benchmarks.<\/p>\n<h2>O futuro da voz sint\u00e9tica<\/h2>\n<p>Para a Fish Audio, o lan\u00e7amento do S2 representa um passo importante na evolu\u00e7\u00e3o da tecnologia de voz baseada em IA. A empresa resume essa vis\u00e3o com a frase:<\/p>\n<p><strong>\u201cA verdadeira liberdade da linguagem come\u00e7a agora.\u201d<\/strong><\/p>\n<p>A ideia \u00e9 sair de sistemas que apenas \u201cleem textos\u201d para um novo est\u00e1gio de <strong>vozes digitais com emo\u00e7\u00e3o, personalidade e contexto<\/strong>, abrindo caminho para aplica\u00e7\u00f5es cada vez mais realistas em comunica\u00e7\u00e3o, entretenimento e produtividade.<\/p>\n<h2>Links do projeto<\/h2>\n<p>GitHub:<br \/>\n<a href=\"https:\/\/github.com\/fishaudio\/fish-speech\/\">https:\/\/github.com\/fishaudio\/fish-speech\/<\/a><\/p>\n<p>Hugging Face:<br \/>\n<a href=\"https:\/\/huggingface.co\/fishaudio\/s2-pro\/\">https:\/\/huggingface.co\/fishaudio\/s2-pro\/<\/a><\/p>\n<p>Com recursos avan\u00e7ados de controle emocional, baixa lat\u00eancia e suporte a m\u00faltiplos locutores, o <strong>Fish Audio S2<\/strong> tem potencial para se tornar uma das tecnologias mais importantes no ecossistema de <strong>voz sint\u00e9tica open source<\/strong> nos pr\u00f3ximos anos.<\/p>","protected":false},"excerpt":{"rendered":"<p>A Fish Audio anunciou oficialmente o lan\u00e7amento do seu novo modelo de texto-para-fala (TTS) de \u00faltima gera\u00e7\u00e3o, chamado S2, marcando [&hellip;]<\/p>","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[1],"tags":[],"class_list":["post-2219","post","type-post","status-publish","format-standard","hentry","category-ai-news"],"_links":{"self":[{"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/posts\/2219","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/comments?post=2219"}],"version-history":[{"count":0,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/posts\/2219\/revisions"}],"wp:attachment":[{"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/media?parent=2219"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/categories?post=2219"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/hizhongguo.com\/index.php\/wp-json\/wp\/v2\/tags?post=2219"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}