Notícia do Gate, 24 de Abril — A DeepSeek V4 publicou resultados de avaliações de raciocínio matemático formal, obtendo uma pontuação perfeita de 120/120 no Putnam-2025, empatando com a Axiom pelo primeiro lugar.
No regime prático com LeanExplore e amostragem condicionada, o V4-Flash-Max marcou 81.00 no benchmark Putnam-200 Pass@8, superando significativamente o Seed-2.0-Prover (35.50), o Gemini 3 Pro (26.50) e o Seed-1.5-Prover (26.50). Os resultados do regime de fronteira mostraram o V4 à frente do Seed-1.5-Prover (110/120) e do Aristotle (100/120).
O V4 utiliza uma abordagem híbrida de raciocínio formal-informal: o raciocínio informal gera soluções candidatas em linguagem natural, a auto-verificação filtra os resultados e um agente formal completa provas rigorosas no Lean. Os resultados do regime de fronteira usaram escalamento computacional em grande escala, enquanto as pontuações do regime prático reflectem melhor as capacidades padrão de implementação.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
DeepSeek angaria financiamento a uma valorização de $45B no meio da concorrência em IA
O laboratório chinês de IA DeepSeek está em conversações para angariar a sua primeira ronda de financiamento a uma avaliação reportada de 45 mil milhões de dólares, segundo a TechCrunch. Esta avaliação representa um aumento significativo face a uma avaliação estimada de 20 mil milhões de dólares apenas algumas semanas antes, na sequência da atenção atraída pelos modelos de IA da empresa para
CryptoFrontier9m atrás
Huawei e Cambricon integram o DeepSeek V4 em chips domésticos; estão previstas 750.000 unidades Ascend 950PR para 2026
De acordo com o South China Morning Post, a Huawei e a Cambricon começaram a integrar o DeepSeek V4 com plataformas de chips domésticas em 2026. A Huawei disse que o V4 já funciona no seu Ascend 950PR e noutros processadores Ascend, com planos para produzir aproximadamente 750.000 chips 950PR este ano, após a produção em massa st
GateNews30m atrás
A Microsoft pode atrasar a meta de energia com zero carbono até 2030 à medida que a expansão dos centros de dados de IA aumenta as necessidades energéticas
De acordo com a Bloomberg, a Microsoft poderá atrasar ou abandonar a sua meta para 2030 de forma a corresponder a todo o consumo de eletricidade a cada hora com energia sem carbono, à medida que a expansão dos centros de dados para IA aumenta as necessidades de energia e os custos. A meta 100/100/0, anunciada em 2021, é mais exigente do que a meta anual da empresa de correspondência de energia renovável
GateNews30m atrás
A Google DeepMind vai treinar IA para o Eve Online e adquire uma participação minoritária na Fenris Creations
Segundo a Bloomberg, a 6 de maio, a Google DeepMind anunciou que vai treinar sistemas de IA em Eve Online e vai tomar uma participação minoritária na Fenris Creations, a empresa por detrás do jogo de espaço multijogador. O investimento está na ordem dos milhões de dólares. O executivo da DeepMind Adrian Bolton disse que Eve Online testa IA
GateNews30m atrás
A Apple eleva o investimento em I&D para o nível mais alto de 30 anos com o impulso nas tecnologias de IA
A Apple gastou 10,3% da sua receita em investigação e desenvolvimento no seu trimestre de março, registando a maior percentagem de I&D em pelo menos 30 anos, à medida que a empresa intensifica o desenvolvimento de IA, segundo a CNBC. A despesa em I&D subiu quase 34% em termos homólogos, enquanto a receita aumentou 17%, de acordo com a empresa. A compa
CryptoFrontier39m atrás
A Anthropic assina a SpaceX Colossus 1 para computação de IA
A Anthropic anunciou na quarta-feira que vai utilizar toda a capacidade de computação do centro de dados Colossus 1, da SpaceX, assinalando a mais recente parceria na expansão da infraestrutura de IA do criador do Claude.
O acordo reforça a estratégia da Anthropic de garantir recursos informáticos dedicados à medida que aumenta a sua escala de IA
CryptoFrontier57m atrás