Gate News Nachricht, 24. April — DeepSeek V4 hat Ergebnisse aus formalen mathematischen Schlussfolgerungsbewertungen veröffentlicht und eine perfekte Punktzahl von 120/120 bei Putnam-2025 erreicht, womit es mit Axiom für den ersten Platz gleichzieht.
Im praktischen Regime, das LeanExplore und eingeschränktes Sampling nutzt, erzielte V4-Flash-Max 81,00 auf dem Putnam-200 Pass@8-Benchmark und übertraf damit Seed-2.0-Prover (35.50), Gemini 3 Pro (26.50) und Seed-1.5-Prover (26.50) deutlich. Die Ergebnisse aus dem Frontier-Regime zeigten, dass V4 Seed-1.5-Prover (110/120) und Aristotle (100/120) voraus ist.
V4 nutzt einen hybriden Ansatz aus formaler und informeller Schlussfolgerung: Informelles Reasoning erzeugt Kandidatenlösungen in natürlicher Sprache, die Selbstverifikation filtert die Ergebnisse, und ein formaler Agent vervollständigt die rigorosen Beweise in Lean. Die Ergebnisse aus dem Frontier-Regime nutzten eine groß angelegte rechnerische Skalierung, während die Scores im praktischen Regime die Fähigkeiten bei einer standardmäßigen Bereitstellung besser widerspiegeln.
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to
Disclaimer.
Verwandte Artikel
a16z bringt den 5. Fonds mit 2,2 Milliarden US-Dollar für Kryptowährungen an den Start und führt bei drei KI-Startups an.
Laut Ankündigung von a16z (Andreessen Horowitz) am 5. Mai hat die Risikokapitalgesellschaft offiziell den fünften, auf Kryptowährungen spezialisierten Fonds „Crypto Fund 5“ aufgelegt. Das Emissionsvolumen beläuft sich auf 2,2 Milliarden US-Dollar. Gleichzeitig gab a16z bekannt, dass es bei den Unternehmen Tessera Labs (Unternehmen für KI-Integration), Ethos (KI-Recruiting-Plattform) und Glif (KI-Creator-Plattform) in einer Lead-Rolle bei Finanzierungsrunden investiert.
MarketWhisper28M her
Cursor engagiert ehemaligen Palo-Alto-Networks-Manager Simon Green, um die Expansion in Asien zu leiten
Laut Cursor AI hat das KI-Coding-Unternehmen seinen regionalen Hauptsitz in Singapur eingerichtet und Simon Green, einen ehemaligen leitenden Manager bei Palo Alto Networks, zum Regionalpräsidenten ernannt. Green verbrachte mehr als 10 Jahre bei Palo Alto Networks, wo er dabei half, das Wachstum des Unternehmens in Japan und Asien P zu fördern
GateNews44M her
Der Gründer von Pi Network nimmt an Consensus 2026 teil und hält einen Vortrag zum Thema Identitätsverifizierung im Zeitalter der KI
Laut der offiziellen X-Konto-Mitteilung von Pi Network hielt Pi Network Mitgründer Chengdiao Fan am 6. Mai auf der in den USA in Miami stattfindenden Consensus 2026 seine Rede zum Thema „Praktische Verschmelzung von Web3, KI und Blockchain“. Korkalises nahm derweil am 7. Mai an einer Diskussion mit dem Titel „Wie man in einer KI-Welt beweist, dass man echt ist“ teil.
MarketWhisper1Std her
Apple stimmt zu, 250 Millionen US-Dollar zu zahlen, um einen Sammelklage-Vergleich im Zusammenhang mit Apple Intelligence abzuschließen
Laut einem Bericht der BBC vom 6. Mai hat Apple am 5. Mai vor einem US-Bundesgericht in Kalifornien eine vorgeschlagene Vergleichsvereinbarung eingereicht und sich bereit erklärt, 250 Millionen US-Dollar (rund 184 Millionen Pfund Sterling) zu zahlen, um eine Sammelklage beizulegen, in der Apple vorgeworfen wird, Apple Intelligence und Siri-Funktionen mit irreführenden Werbeaussagen beworben zu haben. Apple weist in der Vereinbarung jegliches Fehlverhalten zurück; die Vereinbarung muss noch von einem Richter genehmigt werden.
MarketWhisper1Std her
Tencent Hunyuan Hy3-Vorschau verzeichnet in zwei Wochen ein 10-faches Token-Wachstum
Seit dem Start vor zwei Wochen hat die Hy3-Vorschau von Tencent Hunyuan im Vergleich zum vorherigen Hy2-Modell einen zehnfachen Anstieg bei den Token-Calls verzeichnet. Besonders stark gewachsen ist die Token-Nutzung in Code- und Agent-Szenarien. Zu den Anwendungen, die Zuwächse melden, gehören unter anderem WorkBuddy, Codebuddy und Qclaw.
GateNews1Std her