Com a aproximação do lançamento, mais detalhes técnicos do novo modelo DeepSeek V4 começam a surgir. De acordo com fontes confiáveis, como o conhecido vazador Legit, a DeepSeek iniciou testes internos secretos da versão prévia do modelo, codinome “sealion-lite” (versão leve do leão-marinho), com participantes que assinaram acordos de confidencialidade rigorosos.
Em relação à versão V3, o DeepSeek V4 promete um salto significativo. O novo modelo não só terá capacidade nativa de processamento multimodal, como também expandirá sua janela de contexto para impressionantes 1 milhão de tokens. Isso significa que ele será capaz de processar grandes volumes de dados de uma vez, como vários livros ou extensos repositórios de código, permitindo um raciocínio lógico mais profundo. Testes iniciais revelaram que o V4 superou as expectativas, apresentando resultados impressionantes em tarefas complexas, como a geração de gráficos vetoriais SVG, além de ter um desempenho muito superior aos modelos atuais disponíveis nas plataformas web e apps.
A internet obteve informações de que o DeepSeek V4 será um modelo de base com trilhões de parâmetros, e o grande aumento em sua escala exigiu um longo ciclo de treinamento, o que fez com que o lançamento fosse adiado em relação ao cronograma inicial. Uma mudança interessante foi a decisão da DeepSeek de não fornecer prévias para empresas de chips dos EUA, como Nvidia e AMD, e, ao invés disso, optar por liberar o acesso antecipado para fornecedores chineses de chips, como a Huawei, garantindo que o modelo fosse otimizado e adaptado para plataformas de computação locais.
Além disso, o repositório da DeepSeek no GitHub passou por uma série de atualizações recentes. Embora muitas dessas mudanças sejam relacionadas à organização do código após o feriado, também há uma quantidade significativa de atualizações relacionadas à integração de APIs e soluções empresariais. Com rumores sobre um possível anúncio na próxima semana, a expectativa é alta tanto no mercado de desenvolvedores quanto na comunidade global de IA. O DeepSeek V4 pode ser a chave para uma nova onda de inovação, consolidando a DeepSeek como uma gigante na indústria de IA, conhecida por seu compromisso com a alta performance e custo-benefício.
Resumo:
🚀 Escala de parâmetros impressionante: O DeepSeek V4 será um modelo com trilhões de parâmetros, suportando entradas de texto de até milhões de tokens e oferecendo poderosas capacidades multimodais para raciocínio lógico e criação.
🇨🇳 Prioridade para a computação nacional: A DeepSeek escolheu priorizar a adaptação para chips de fornecedores chineses, como a Huawei, reduzindo a dependência de fornecedores externos e otimizando o desempenho em plataformas de hardware local.
🗓️ Contagem regressiva para o lançamento: O teste da versão leve já foi iniciado discretamente, e fontes externas sugerem que o lançamento pode acontecer já na próxima semana. Isso gerou grande expectativa tanto na comunidade global de IA quanto nos mercados financeiros.