DeepSeek veröffentlicht die V4-Open-Source-Modellserie mit 1,6T Parametern und MIT-Lizenz

Gate News Nachricht, 24. April — DeepSeek hat die V4-Serie Open-Source-Modelle unter der MIT-Lizenz veröffentlicht; die Gewichte sind nun auf Hugging Face und ModelScope verfügbar. Die Serie umfasst zwei Mixture-of-Experts-(MoE)-Modelle: V4-Pro mit 1,6 Billionen Gesamtparametern und 49 Milliarden aktivierten pro Token sowie V4-Flash mit 284 Milliarden Gesamtparametern und 13 Milliarden aktivierten pro Token. Beide unterstützen ein Kontextfenster von 1 Million Token.

Die Architektur bietet drei zentrale Upgrades: einen hybriden Aufmerksamkeitsmechanismus, der komprimierte spärliche Attention (CSA) und stark komprimierte Attention (HCA) kombiniert, wodurch der Overhead für Long-Context deutlich reduziert wird — die Inferenz-FLOPs von V4-Pro für 1M Kontext betragen lediglich 27% von denen von V3.2, und der KV-Cache (VRAM zum Speichern historischer Informationen während der Inferenz) liegt nur bei 10% von dem von V3.2; manifold-beschränkte Hyperverbindungen (mHC) ersetzen traditionelle Residualverbindungen, um die Stabilität der Signalübertragung zwischen Schichten zu verbessern; und der Muon-Optimizer für schnellere Trainingskonvergenz. Das Pre-Training verwendete über 32 Billionen Token an Daten.

Beim Post-Training wird ein zweistufiger Ansatz genutzt: Zuerst werden domänenspezifische Experten trainiert, über supervised fine-tuning (SFT) und GRPO-Reinforcement-Learning, dann werden sie zu einem einzelnen Modell zusammengeführt, durch Online-Distillation. V4-Pro-Max (highest inference mode) beansprucht, das stärkste Open-Source-Modell mit erstklassigen Coding-Benchmarks zu sein und die Lücken zu Closed-Source-Frontier-Modellen bei Reasoning- und Agent-Tasks deutlich zu verringern. V4-Flash-Max erreicht Pro-Level-Reasoning-Performance mit ausreichend Budget für Rechenleistung, ist jedoch durch die Parametervolumen-Größe bei reinem Wissen und komplexen Agent-Tasks begrenzt. Die Gewichte werden in gemischter FP4+FP8-Präzision gespeichert.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Geopolitische Risiken sind laut der Frühjahrsumfrage der US-Notenbank (Federal Reserve) das Top-Thema, während KI auf den dritten Platz aufsteigt

Laut der Frühjahrsumfrage 2026 der US-Notenbank Federal Reserve stiegen geopolitische Risiken zur größten Sorge der Befragten auf, ein Platz gegenüber der Herbstumfrage 2025. Künstliche Intelligenz verbesserte sich auf den dritten Platz von fünf, während Private Credit auf den vierten Platz von neun kletterte. Inflation und

GateNews2Std her

OpenAIs GPT-5.5-Cyber rüstet Cyberverteidiger auf

OpenAI hat GPT-5.5-Cyber für geprüfte Cyber-Verteidiger veröffentlicht und ihnen reduzierte Schutzvorkehrungen für spezialisierte Security-Workflows gegeben. Zusammenfassung OpenAIs GPT-5.5-Cyber ist das freizügigste Modell in seiner Reihe und wird in einer begrenzten Vorschau für genehmigte Partner bereitgestellt, die fortgeschrittene Security-Arbeiten durchführen. Geprüft

Cryptonews4Std her

SoftBank kürzt den von OpenAI unterstützten Finanzierungsplan von $10B auf $6B angesichts von Bedenken der Kreditgeber

Laut ChainCatcher kürzt SoftBank Group einen Finanzierungsplan, der durch OpenAI-Aktien abgesichert ist, und skaliert ihn von etwa 10 Milliarden US-Dollar auf 6 Milliarden US-Dollar herunter. Kreditgeber haben Bedenken hinsichtlich der Struktur der Transaktion und der Verlässlichkeit der OpenAI-Bewertung als Privatunternehmen geäußert, was zu einem Schlüsselfaktor wird

GateNews7Std her

Schritt Audio 2,5 in Echtzeit veröffentlicht: Subjektiver Score 80,41 übertrifft GPT-Realtime-1.5 um 18%, Sprachanrufe kosten 3,8 Yuan/Stunde

Laut Beating, Step Audio 2,5 Realtime, ein End-to-End-Real-Time-Sprachmodell von Step Cosmos, ist im April 2026 auf seiner Open-Platform-API gestartet. Das Modell legt den Fokus auf natürliche Konversation mit anpassbaren Charakter-Personas und paralinguistischem Wahrnehmungsvermögen (Ton, Pausen, Seufzer). In offiziell

GateNews8Std her

TCI Fund verkauft fast $8B -Anteile an Microsoft, nennt eine Bedrohung durch KI als Grund

Laut Financial Times hat Chris Hohns Hedgefonds TCI kürzlich nahezu 8 Milliarden US-Dollar im Wert von Microsoft-Aktien abgestoßen. Der Fonds teilte den Anlegern mit, dass künstliche Intelligenz eine Bedrohung für Microsofts dominante Software darstellt.

GateNews8Std her

Tessera Labs schließt eine $60M -Finanzierungsrunde ab, angeführt von a16z

Laut Odaily gab der KI-Automatisierungs-Startup Tessera Labs die Fertigstellung einer Finanzierungsrunde über 60 Millionen US-Dollar bekannt, die von Andreessen Horowitz (a16z) angeführt wurde; außerdem waren Foundation Capital, Myriad Venture Partners und Osage University Partners beteiligt. Die KI-nativen Plattform des Unternehmens automatisiert das Enterprise-

GateNews10Std her
Kommentieren
0/400
Keine Kommentare