Mensagem do Gate News, 25 de abril — O DeepSeek lançou versões de prévia de V4-Pro e V4-Flash em 24 de abril, ambos modelos de pesos abertos com janelas de contexto de um milhão de tokens. O V4-Pro tem 1,6 trilhão de parâmetros no total, mas ativa apenas 49 bilhões por passagem de inferência usando uma arquitetura de Mixture-of-Experts. O V4-Flash tem 284 bilhões de parâmetros no total com 13 bilhões ativos.
Os preços são significativamente mais baixos do que os concorrentes: o V4-Pro custa US$ 1,74 por milhão de tokens de entrada e US$ 3,48 por milhão de tokens de saída—aproximadamente 98% menos do que o GPT-5.5 Pro da OpenAI ($30 input, $180 output) e cerca de um-vigésimo do custo do Claude Opus 4.7. O V4-Flash é precificado em US$ 0,14 de entrada e US$ 0,28 de saída por milhão de tokens. Ambos os modelos são open-source sob licença MIT e podem ser executados localmente gratuitamente.
O DeepSeek obteve ganhos de eficiência por meio de dois novos mecanismos de atenção: Compressed Sparse Attention e Heavily Compressed Attention, que reduzem os custos de computação para 27% do predecessor V4-Pro (V3.2) e 10% para o V4-Flash. A empresa treinou o V4 parcialmente em chips Huawei Ascend, contornando as restrições de exportação dos EUA a processadores Nvidia avançados. O DeepSeek afirmou que, uma vez que 950 novos supernós entrem em operação mais tarde em 2026, o preço cairá ainda mais.
Em benchmarks de desempenho, o V4-Pro-Max fica em primeiro lugar no Codeforces competitive programming (3.206 score, ficando em torno de 23º entre os competidores humanos) e obtendo 90,2% em problemas de matemática do Apex Shortlist versus 85,9% do Claude Opus 4.6. No entanto, fica para trás em benchmarks de multitarefa: MMLU-Pro (87,5% vs 91,0% do Gemini-3.1-Pro) e Humanity’s Last Exam (37,7% vs 44,4%). Em tarefas de longo contexto, o V4-Pro lidera modelos open-source, mas perde para o Claude Opus 4.6 em testes de recuperação MRCR.
O V4-Pro introduz o “interleaved thinking,” permitindo que fluxos de trabalho de agentes retenham contexto de raciocínio entre múltiplas chamadas de ferramentas sem descarregar entre as etapas. Ambos os modelos oferecem integrações de codificação com Claude Code e OpenCode. De acordo com a pesquisa com desenvolvedores do DeepSeek com 85 usuários, 52% disseram que o V4-Pro estava pronto como seu agente padrão de codificação, com 39% inclinados a adotar. Os endpoints antigos deepseek-chat e deepseek-reasoner serão descontinuados em 24 de julho de 2026.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Google e Naver impulsionam anúncios em ferramentas de busca por IA; a receita do Naver no 1T sobe 16,3% para US$ 2,22 bilhões
De acordo com o The Korea Times, o Google e a Naver estão movendo anúncios para ferramentas de busca com IA, à medida que a IA generativa remodela o comportamento nas buscas e eleva os custos de computação. O Google está sinalizando abertura para anúncios no Gemini, enquanto a Naver planeja testar anúncios em estilo de resposta no seu produto AI Briefing no segundo trimestre.
Naver
GateNews8m atrás
Samsung interrompe as vendas de eletrodomésticos na China para mudança de foco na IA
A Samsung Electronics anunciou em 6 de maio que vai encerrar as vendas de eletrodomésticos no continente da China, segundo o South China Morning Post. A saída abrange TVs, geladeiras, ar-condicionado, máquinas de lavar, secadoras, aspiradores de pó e purificadores de ar, enquanto a empresa muda o foco estratégico para
CryptoFrontier9m atrás
Reid Hoffman: agentes de IA precisarão de sistemas de confiança em criptomoedas
Reid Hoffman, sócio da Greylock e cofundador do LinkedIn, afirmou que agentes autônomos precisarão de sistemas de confiança baseados em cripto para transacionar pela internet aberta, sugerindo que esse desenvolvimento pode permitir um retorno para os NFTs.
A declaração de Hoffman conecta o surgimento de agentes autônomos ao
CryptoFrontier9m atrás
SoftBank dispara 16,5% com a alta dos chips de IA impulsionando as ações do Japão em 7 de maio
De acordo com a CNBC, o SoftBank Group subiu 16,5% em 7 de maio depois que os mercados do Japão reabriram após a pausa da Golden Week. Os ganhos vieram quando os investidores correram atrás de uma alta global em ações de IA e de chips, que levou o Nikkei 225 a uma máxima histórica. A Advantest subiu 7,8%, a Tokyo Electron ganhou 9,2% e a Renesas
GateNews29m atrás
CEO da Anthropic confirma pessoalmente crescimento de 80 vezes no 1T: entenda por que é preciso conquistar toda a capacidade de computação da SpaceX
O CEO da Anthropic, Dario Amodei, afirmou no evento Code with Claude que a receita anualizada e o uso previstos para o Q1 seriam 10 vezes, mas acabaram crescendo 80 vezes; ele descreveu como “louco, impossível de acompanhar”, mas vai acelerar a oferta de mais capacidade de computação e flexibilizar os limites dos usuários. No mesmo dia, também foi anunciado que a empresa adquiriu toda a capacidade de computação do SpaceX Colossus 1 (cerca de 300+ MW, 220 mil GPUs da NVIDIA), com previsão de entrada em operação em até um mês, como cenário comercial por trás do crescimento. Ainda não foi divulgado um valor específico; os múltiplos serão confirmados nos próximos resultados financeiros.
ChainNewsAbmedia35m atrás
a16z lança fundo de criptomoedas de US$ 2,2 bilhões na 5ª rodada, liderando o investimento em três startups de IA
De acordo com o anúncio da a16z (Andreessen Horowitz) em 5 de maio, a gestora de venture capital lançou oficialmente o quinto fundo exclusivo de criptomoedas, “Crypto Fund 5”, com um montante de captação de US$ 2,2 bilhões. Na mesma ocasião, a a16z anunciou que liderou os aportes nas empresas de integração de IA Tessera Labs, na plataforma de contratação de IA Ethos e na plataforma de criação de IA Glif.
MarketWhisper1h atrás