Google lance des puces TPU de 8e génération améliorant le ratio performance-prix, sépare l’entraînement et l’inférence

Message Gate News, 22 avril — Google Cloud a annoncé la sortie de ses puces TPU (Tensor Processing Unit) sur mesure de 8e génération, le 22 avril. La nouvelle gamme comprend TPU 8t, conçu spécifiquement pour les tâches d’entraînement à l’IA, et TPU 8i, optimisé pour les charges de travail d’inférence IA. Les deux puces seront disponibles plus tard cette année. Google a également dévoilé de nouveaux outils pour construire des agents d’IA et annoncé un fonds $750 million pour accélérer l’adoption de l’IA en entreprise.

TPU 8t offre 2,8 fois les performances de l’ancienne TPU Ironwood de génération précédente de Google au même niveau de prix. TPU 8i améliore les performances de 80% par rapport à son prédécesseur et intègre une architecture de mémoire vive statique à accès aléatoire (SRAM) pour fournir « un débit à grande échelle rentable et une faible latence, permettant à des millions d’agents de fonctionner simultanément », selon le PDG Sundar Pichai. Par rapport à Ironwood, les TPU 8t et TPU 8i atteignent toutes deux plus du double de l’efficacité performance-par-watt, avec une amélioration de 124% pour TPU 8t et de 117% pour TPU 8i. Google a optimisé l’efficacité énergétique sur l’ensemble de la pile technologique et intégré des systèmes de gestion dynamique de l’alimentation qui ajustent la consommation selon la demande en temps réel.

Les modèles first-party de Google traitent désormais plus de 160 milliards de tokens par minute via des appels directs à l’API client, contre 100 milliards le trimestre dernier. L’IA génère désormais 75% de tout le nouveau code chez Google, contre 50% à l’automne de l’année dernière. Gemini Enterprise, l’offre entreprise de Google, a progressé de 40% d’un trimestre sur l’autre en utilisateurs actifs mensuels payants. L’entreprise s’attend à investir légèrement plus de la moitié de son budget de calcul pour l’apprentissage automatique dans des services cloud d’ici 2026 afin de mieux servir les clients cloud et les partenaires. Google étend aussi sa collaboration avec Broadcom pour développer et fournir des puces TPU sur mesure pour les générations futures, alors que de grandes entreprises technologiques recherchent des alternatives aux GPU coûteux et contraints en approvisionnement de NVIDIA et AMD.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Amazon et OpenAI élargissent leur partenariat : des modèles mis en ligne sur Bedrock, l’exclusivité de Microsoft prend fin

OpenAI, le 3 mai, a annoncé étendre sa collaboration avec les services cloud d’Amazon (AWS) : ses modèles OpenAI et ses agents d’encodage Codex seront proposés aux clients AWS via Amazon Bedrock. D’après un article de CNBC, cette extension constitue une étape clé après la fin, fin avril, du contrat d’exclusivité cloud entre OpenAI et Microsoft : OpenAI passe du statut de « seul cloud Microsoft » à un déploiement multi-cloud. AWS, de son côté, a déjà finalisé l’intégration initiale des produits OpenAI sur la plateforme Bedrock. Contexte : fin du contrat d’exclusivité OpenAI–Microsoft, prolongation de la licence IP jusqu’en 2032 Fin avril, OpenAI et Microsoft ont conclu un nouvel accord : la structure initiale « Microsoft avec accès exclusif aux produits et à la propriété intellectuelle (IP) d’OpenAI » prend fin, et Op

ChainNewsAbmediaIl y a 3h

Les chercheurs déploient la technologie DPN-LE pour modifier des traits de personnalité de l’IA, en ne modifiant que 0,5 % des neurones

D'après BlockBeats, le 3 mai, le chercheur en IA Brian Roemmele a révélé que sa société Zero-Human a déployé la technologie DPN-LE (Dual Personality Neuron Localization and Editing) afin d’ajuster avec précision

GateNewsIl y a 4h

Claude vérifie l’horloge toutes les 15 minutes après avoir obtenu l’accès à l’outil de correction du retard

D’après le développeur Om Patel, Claude AI a commencé à vérifier fréquemment l’horloge après avoir obtenu l’accès à un outil de temps le 3 mai, le modèle vérifiant toutes les 15 minutes. L’observation met en évidence que les grands modèles de langage n’avaient auparavant pas de perception du temps native et n’étaient pas conscients de l’heure actuelle ou

GateNewsIl y a 5h

Founders Fund clôture un fonds flagship de 6 milliards de dollars, le plus important depuis sa création, le 3 mai

D’après Bloomberg, Founders Fund a finalisé une levée de fonds pour son dernier fonds phare à 6 milliards de dollars le 3 mai, dépassant largement son fonds précédent d’environ 3,4 milliards de dollars. Le fonds, cofondé par le milliardaire Peter Thiel, se concentrera sur des secteurs à forte croissance, notamment l’intelligence

GateNewsIl y a 6h

Dernier sondage POLITICO : 45 % des Américains disent que l’investissement dans la crypto est trop risqué, 44 % s’inquiètent de l’avancée trop rapide de l’IA

Selon un sondage POLITICO, malgré les financements politiques importants injectés par les secteurs de l’IA et de la crypto dans les élections législatives américaines de mi-mandat de 2026, le public américain reste largement sceptique à l’égard des deux secteurs. L’enquête a révélé que 45% des Américains pensent que l’investissement dans les cryptomonnaies n’en vaut pas la peine.

GateNewsIl y a 6h

OpenAI semble préconiser une introduction en bourse en 2027, tandis qu’Attman soutient une mise en bourse au T4 2026

La directrice financière d’OpenAI, Sarah Friar, se montre prudente concernant le calendrier d’une introduction en bourse (IPO) en 2026, soulignant que les contrats portant sur la puissance de calcul et les centres de données, représentant près d’un billion de dollars, dépassent de loin les revenus annuels actuels de 25 milliards de dollars. Si la croissance ne parvient pas à couvrir les engagements, le risque sera réduit par une décote du marché. Le désaccord avec le PDG Sam Altman, qui défend publiquement une entrée en bourse au quatrième trimestre 2026, met en évidence des divergences : Friar penche pour un report à 2027 afin d’instaurer une discipline financière. La société a toutefois publié à plusieurs reprises des communiqués afin de démentir l’existence de dissensions internes.

ChainNewsAbmediaIl y a 8h
Commentaire
0/400
Aucun commentaire