PDG : Le modèle traite plus de 16 milliards de tokens par minute

robot
Création du résumé en cours

À 20h00, le 22 avril, heure de Pékin, la conférence Google Cloud Next a débuté, le PDG de Google, Sundar Pichai, a publié un message indiquant qu’en utilisant directement l’API pour ses clients, le modèle de Google traite plus de 16 milliards de tokens par minute, contre 10 milliards de tokens le trimestre précédent. Il prévoit qu’en 2026, plus de la moitié des investissements totaux de Google en calcul d’apprentissage automatique seront consacrés aux activités cloud. Lors de la conférence, Google lancera également la huitième génération de TPU, ainsi que deux puces pour agents intelligents — TPU 8t et TPU 8i, mentionnées dans le blog comme étant conçues pour faire face à des charges de travail d’intelligence artificielle exigeantes et pour s’adapter à l’évolution constante des architectures de modèles. (Yicai)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler