DeepSeek V4 entfacht US-Debatte: Think Tank stellt die Chip-Nutzung infrage, Replit-CEO verteidigt offene Innovation

Gate News-Mitteilung, 24. April — In den Vereinigten Staaten ist eine Debatte über die technologischen Fähigkeiten und die Compliance von DeepSeek V4 ausgebrochen. Chris McGuire, Senior Fellow beim Council on Foreign Relations (CFR) und ehemaliger Beamter im Nationalen Sicherheitsrat des Weißen Hauses sowie im Verteidigungsministerium, veröffentlichte eine Analyse, in der argumentiert wird, dass V4 die US-China-KI-Wettbewerbslandschaft nicht verändert habe. Laut McGuire erkennt das eigene V4-Report von DeepSeek an, dass seine Schlussfolgerungsfähigkeiten Frontier-Modelle um etwa 3 bis 6 Monate hinter sich lassen, gemessen anhand von Benchmarks gegen GPT-5.2 und Gemini 3.0 Pro, die sechs Monate zuvor veröffentlicht wurden.

McGuire äußerte Bedenken, dass der V4-Report zwar Anpassungen in der Inferenzphase an NVIDIA-GPUs und Huawei Ascend NPUs offenlegt, jedoch öffentlich keine Angaben zu den GPU-Modellen oder den Trainingskosten macht, die während der Entwicklung verwendet wurden. Er fragte, ob dieses Schweigen auf den Einsatz exportkontrollierter NVIDIA-Blackwell-Chips hindeutet, und verwies darauf, dass V3 zuvor behauptet habe, 2.000 H800-GPUs zu einem Preis von 5,57 Millionen US-Dollar genutzt zu haben. DeepSeek hat die Nutzung von Blackwell bestritten und erklärte, das Modell sei auf NVIDIA H800- und Huawei Ascend 910C-Prozessoren trainiert worden.

Der Replit-CEO Amjad Masad widersprach McGuires Analyse und argumentierte, dass chinesische Wissenschaftler öffentlich echte Durchbrüche im Bereich KI teilen, während amerikanische politische Entscheidungsträger und Lobbyisten die Bedenken über „China-Distillation“ verstärken. Masad hob architektonische Innovationen hervor, die in DeepSeeks offiziellen Aussagen offengelegt wurden, darunter Komprimierung der Attention auf Token-Ebene (DeepSeek Sparse Attention) und erhebliche Effizienzverbesserungen für die Berechnung in langen Kontexten. Er bemerkte, dass V4-Pro eine deutlich niedrigere Inferenz-Compute pro Token sowie geringere Anforderungen an den KV-Cache bei 1M-Kontextlängen zeigt als V3.2. Dabei betonte er, dass diese architektonischen Fortschritte nicht mit Distillation von Trainingsdaten zusammenhängen und dass alle Forschenden, einschließlich amerikanischer Labore, von offenen Entwicklungen profitieren können.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare