Tinygrad annonce que GLM 5.2 atteint 120 jetons par seconde sur une configuration double Blackwell pour 150 000 dollars

D’après BlockBeats, le 21 juin, Tinygrad a rapporté que GLM 5.2 atteint une vitesse d’inférence de 120 jetons par seconde sur une configuration tinybox à double réseau, basée sur une architecture Blackwell. La configuration à 150 000 dollars est disponible soit sous la forme de deux unités standard tinybox, soit d’une seule unité tinybox Pro. Tinygrad présente cette offre comme une alternative de déploiement privé aux services d’inférence basés sur le cloud, avec la promesse « buy once, never pay cloud fees again ». GLM n’a pas officiellement confirmé ces allégations de performances.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire