Tinygrad berichtet, dass GLM 5.2 auf einer Dual-Blackwell-Konfiguration 120 Tokens pro Sekunde erreicht – für 150.000 US-Dollar

Laut BlockBeats meldete Tinygrad am 21. Juni, dass GLM 5.2 auf einer Dual-Networked-Blackwell-Architektur in der tinybox-Umgebung eine Inferenzgeschwindigkeit von 120 Tokens pro Sekunde erreicht. Die Konfiguration im Wert von 150.000 US-Dollar ist entweder als zwei Standard-tinybox-Einheiten oder als eine tinybox Pro erhältlich. Tinygrad positioniert das Angebot als Alternative für private Deployments zu cloudbasierten Inferenzdiensten, mit dem Slogan „buy once, never pay cloud fees again“. GLM hat die Leistungsbehauptungen bislang nicht offiziell bestätigt.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare