DeepSeek V4 Consegue Pontuação Perfeita no Putnam-2025, Empata com Axiom em Raciocínio Matemático Formal

Mensagem do Gate News, 24 de abril — A DeepSeek V4 publicou resultados de avaliações de raciocínio matemático formal, alcançando uma pontuação perfeita de 120/120 no Putnam-2025, empatando com a Axiom pelo primeiro lugar.

No regime prático usando LeanExplore e amostragem restrita, o V4-Flash-Max obteve 81.00 no benchmark Putnam-200 Pass@8, superando significativamente o Seed-2.0-Prover (35.50), o Gemini 3 Pro (26.50) e o Seed-1.5-Prover (26.50). Os resultados do regime de fronteira mostraram a V4 à frente do Seed-1.5-Prover (110/120) e do Aristotle (100/120).

A V4 emprega uma abordagem híbrida de raciocínio formal-informal: o raciocínio informal gera soluções candidatas em linguagem natural, a auto-verificação filtra os resultados e um agente formal completa provas rigorosas em Lean. Os resultados do regime de fronteira utilizaram escalonamento computacional em larga escala, enquanto as pontuações do regime prático refletem melhor as capacidades padrão de implantação.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

SoftBank dispara 16,5% com a alta dos chips de IA impulsionando as ações do Japão em 7 de maio

De acordo com a CNBC, o SoftBank Group subiu 16,5% em 7 de maio depois que os mercados do Japão reabriram após a pausa da Golden Week. Os ganhos vieram quando os investidores correram atrás de uma alta global em ações de IA e de chips, que levou o Nikkei 225 a uma máxima histórica. A Advantest subiu 7,8%, a Tokyo Electron ganhou 9,2% e a Renesas

GateNews18m atrás

CEO da Anthropic confirma pessoalmente crescimento de 80 vezes no 1T: entenda por que é preciso conquistar toda a capacidade de computação da SpaceX

O CEO da Anthropic, Dario Amodei, afirmou no evento Code with Claude que a receita anualizada e o uso previstos para o Q1 seriam 10 vezes, mas acabaram crescendo 80 vezes; ele descreveu como “louco, impossível de acompanhar”, mas vai acelerar a oferta de mais capacidade de computação e flexibilizar os limites dos usuários. No mesmo dia, também foi anunciado que a empresa adquiriu toda a capacidade de computação do SpaceX Colossus 1 (cerca de 300+ MW, 220 mil GPUs da NVIDIA), com previsão de entrada em operação em até um mês, como cenário comercial por trás do crescimento. Ainda não foi divulgado um valor específico; os múltiplos serão confirmados nos próximos resultados financeiros.

ChainNewsAbmedia25m atrás

a16z lança fundo de criptomoedas de US$ 2,2 bilhões na 5ª rodada, liderando o investimento em três startups de IA

De acordo com o anúncio da a16z (Andreessen Horowitz) em 5 de maio, a gestora de venture capital lançou oficialmente o quinto fundo exclusivo de criptomoedas, “Crypto Fund 5”, com um montante de captação de US$ 2,2 bilhões. Na mesma ocasião, a a16z anunciou que liderou os aportes nas empresas de integração de IA Tessera Labs, na plataforma de contratação de IA Ethos e na plataforma de criação de IA Glif.

MarketWhisper53m atrás

A Cursor contrata ex-executivo da Palo Alto Networks, Simon Green, para liderar a expansão na Ásia

Segundo o Cursor AI, a empresa de codificação com IA estabeleceu sua sede regional em Singapura e nomeou Simon Green, ex-executivo sênior da Palo Alto Networks, como presidente regional. Green passou mais de 10 anos na Palo Alto Networks, onde ajudou a expandir o Japão e a Ásia da empresa em

GateNews1h atrás

Fundador da Pi Network participa do Consensus 2026 e faz palestra sobre verificação de identidade na era da IA

De acordo com o anúncio da conta oficial do X do Pi Network, o cofundador do Pi Network, Chengdiao Fan, fez uma palestra em 6 de maio na conferência Consensus 2026, em Miami, nos EUA, sobre a “integração prática entre Web3, IA e blockchain”. Já o Kocarelis participou em 7 de maio de um debate intitulado “Como provar que você é humano no mundo da IA”.

MarketWhisper1h atrás
Comentário
0/400
Sem comentários