Gate News Mitteilung, 24. April — OpenAI-Ingenieur Clive Chan hat detaillierte Einwände gegen das Kapitel mit den Hardware-Empfehlungen im technischen V4-Bericht erhoben und es im Vergleich zur vielgepriesenen V3-Version als “überraschend mittelmäßig und fehleranfällig” bezeichnet. Die Hardware-Anleitung von V3, die Q&A-Sessions umfasste, die zum beliebtesten Diskussionsthema auf der ISCA-Fachkonferenz wurden, bot spezifische Empfehlungen, die mit den Industriestandards für Interconnects übereinstimmen. V4 hingegen ist weitaus unbestimmter.
Chan stellte systematisch drei zentrale Empfehlungen infrage. Zum Stromverbrauch schlägt der Bericht vor, dass Software-Optimierungen es ermöglichen, dass Chips Rechnen, Speicher und Kommunikation gleichzeitig in voller Kapazität betreiben, und empfiehlt, dass Chiphersteller zusätzlichen Strom-Headroom einplanen. Chan argumentiert, dass das kontraproduktiv ist: Die gesamte Chip-Leistung ist durch physikalische Prozessgrenzen begrenzt, sodass das Zurückhalten von mehr Leistungsreserve nur die Betriebsfrequenz verringert und letztlich die Rechenleistung senkt. In Bezug auf den GPU-zu-GPU-Datentransfer befürwortet der Bericht ein Pull-Modell — bei dem GPUs Daten aktiv abrufen — statt eines Push-Modells und verweist auf den hohen Benachrichtigungsaufwand bei Push-Operationen. Chan bestreitet dies und führt aus, dass Pull tatsächlich langsamer sei und dass verbesserte Fähigkeiten der Netzwerkadapter vorzuziehen wären. Allerdings könnten sich die beiden über unterschiedliche Ebenen des Problems unterhalten: Der Bericht behandelt den Overhead des Benachrichtigungsmechanismus, während Chan sich auf die Übertragungsverzögerung selbst bezieht.
Bei Aktivierungsfunktionen empfiehlt der Bericht, SwiGLU durch einfachere Funktionen zu ersetzen, um die Rechenlast zu reduzieren. Chan sieht darin keinen Nutzen und weist darauf hin, dass Sonic MoE bereits mit SwiGLU die optimale Leistung gezeigt hat. Chan vermutet, dass DeepSeek diesen Abschnitt “absichtlich abgeschwächt” haben könnte.
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to
Disclaimer.
Verwandte Artikel
Amazon und OpenAI weiten die Zusammenarbeit aus: Modelle werden in Bedrock verfügbar gemacht, exklusives Microsoft-Ende
OpenAI gab am 3. Mai bekannt, dass die Zusammenarbeit mit Amazon Web Services (AWS) ausgeweitet wird. OpenAI-Modelle und Codex-Codierungsagenten sollen AWS-Kunden über Amazon Bedrock bereitgestellt werden. Laut CNBC ist dies ein entscheidender nächster Schritt nach dem Ende des Cloud-Exklusivvertrags von OpenAI mit Microsoft Ende April: OpenAI wechselt von „Microsoft-Cloud-alleinig“ hin zu einer Multi-Cloud-Umsetzung. AWS hat derweil bereits die erste Integration von OpenAI-Produkten in die Bedrock-Plattform abgeschlossen.
Hintergrund: OpenAI-Microsoft-Exklusivvertrag endet, IP-Lizenz verlängert bis 2032
Ende April einigten sich OpenAI und Microsoft auf eine neue Vereinbarung: Die bisherige Struktur „Microsoft gegenüber OpenAI-Produkten und IP exklusiver Zugriff“ endet, Op
ChainNewsAbmedia48M her
Forscher setzen DPN-LE-Technologie ein, um KI-Persönlichkeitsmerkmale zu bearbeiten, wobei nur 0,5 % der Neuronen verändert werden
Laut BlockBeats hat der KI-Forscher Brian Roemmele am 3. Mai offengelegt, dass seine Zero-Human Company die DPN-LE-(Dual Personality Neuron Localization and Editing)-Technologie eingesetzt hat, um präzise anzupassen
GateNews1Std her
Claude überprüft jede 15 Minuten die Uhrzeit, nachdem es Zugriff auf das Time-Tool erhalten hat
Laut Angaben des Entwicklers Om Patel begann Claude AI, nachdem es am 3. Mai Zugriff auf ein Tool zur Zeitanzeige erhalten hatte, häufig die Uhr zu überprüfen, wobei das Modell alle 15 Minuten prüfte. Die Beobachtung zeigt, dass große Sprachmodelle zuvor keine native Zeitwahrnehmung hatten und nicht wussten, wie spät es gerade war oder
GateNews2Std her
Founders Fund schließt am 3. Mai seinen Flaggschiff-Fonds im Wert von 6 Milliarden US-Dollar, den größten seit der Gründung
Laut Bloomberg hat der Founders Fund am 3. Mai das Fundraising für seinen neuesten Flaggschiff-Fonds im Wert von 6 Milliarden US-Dollar abgeschlossen und damit deutlich seinen vorherigen Fonds von rund 3,4 Milliarden US-Dollar übertroffen. Der von dem Milliardär Peter Thiel mitgegründete Fonds wird sich auf schnell wachsende Bereiche konzentrieren, darunter künstliche
GateNews3Std her
Aktuelle POLITICO-Umfrage: 45% der Amerikaner sagen, Krypto-Investitionen seien zu riskant, 44% sorgen sich, dass die KI zu schnell voranschreitet
Laut einer POLITICO-Umfrage bleiben die US-Bürger trotz der Tatsache, dass die KI- und die Krypto-Branche im Vorfeld der US-Midterm-Wahlen 2026 erhebliche politische Mittel eingespeist haben, gegenüber beiden Bereichen weitgehend skeptisch. Laut der Erhebung sind 45% der Amerikaner der Ansicht, dass Investitionen in Kryptowährungen nicht im Wert von
GateNews3Std her
OpenAI-Flair fordert einen Börsengang im Jahr 2027, Altman unterstützt die Notierung im Q4 2026
Der Finanzchef von OpenAI, Sarah Friar, steht dem IPO-Zeitplan für 2026 mit Vorsicht gegenüber und verweist darauf, dass die aktuellen Zusagen für Rechenleistung und Rechenzentren im Wert von nahezu 1 Billion US-Dollar deutlich über dem aktuellen jährlichen Umsatz von 25 Milliarden US-Dollar liegen. Wenn das Wachstum die Verpflichtungen nicht überdecken kann, werde das Risiko vom Markt abdiskontiert werden. Damit zeigt sich eine Differenz zu den öffentlich geäußerten Ansichten von CEO Sam Altman, der ein Börsendebüt im 4. Quartal 2026 befürwortet. Friar tendiert dazu, auf 2027 zu verschieben, um finanzielle Disziplin aufzubauen; das Unternehmen hat mehrfach Erklärungen veröffentlicht und interne Meinungsverschiedenheiten dementiert.
ChainNewsAbmedia5Std her