Le tournoi d'échecs LLM s'est terminé : OpenAI o3 a remporté le titre, xAI Grok 4 n'a pas gagné une seule partie et a été complètement éliminé.

動區BlockTempo
XAI3,49%
GROK8,42%

Le tournoi international d’échecs Kaggle AI s’est terminé, l’o3 non entraîné remportant une victoire écrasante 4-0 contre Grok 4, démontrant une capacité de raisonnement extrêmement forte. (Résumé : Musk menace de poursuivre Apple : le classement de l’App Store présente un comportement monopolistique, réprimant délibérément Grok) (Contexte : Grok 4 est maintenant disponible gratuitement, Musk xAI se confronte à GPT-5) Récemment, Kaggle, une filiale de Google, a annoncé les résultats de son “spectacle d’échecs d’intelligence artificielle” le 14 août, où le modèle de langage général d’OpenAI, o3, a balayé Grok 4 de xAI avec un score de 4:0, remportant le championnat et devenant le premier LLM à réussir un blanchissage sans entraînement spécifique. Le tournoi a vu la participation de 8 groupes d’IA sur une durée de trois jours, avec des éliminatoires pour déterminer le vainqueur. Points forts du concours de modèles linguistiques Selon OpenTools.ai, o3 a réussi à enregistrer trois victoires consécutives de 4:0 tout au long de son parcours, éliminant même sa propre version légère, o4 mini, en demi-finale. En revanche, Grok 4 a souvent pris de l’avance en début de partie, mais a perdu à plusieurs reprises en fin de match (sacrifiant la pièce la plus dynamique, la Reine). Le grand maître d’échecs Hikaru Nakamura a évalué o3 comme ayant “très peu d’erreurs”, notant que Grok 4 avait souvent des tactiques d’auto-sabotage. L’ancien champion du monde Magnus Carlsen a décrit le style de jeu de Grok comme : regarder des enfants jouer aux échecs. Il estime que le Elo de Grok est d’environ 800, tandis que celui de o3 est d’environ 1200, bien en dessous des meilleurs joueurs humains ou des IA spécialisées dans les échecs. Elo : un système de notation professionnelle (anglais : Elo rating system) est une méthode d’évaluation créée par le physicien américain d’origine hongroise Arpad Elo, qui mesure le niveau des diverses activités de jeu, reconnue comme la norme d’évaluation des niveaux de jeu dans le monde d’aujourd’hui, largement utilisée dans des sports comme les échecs, le go, le football et le basket-ball. Le score Elo le plus élevé en échecs a été établi par Magnus Carlsen avec 2882 points. Confrontation entre IA générale et IA spécialisée Les systèmes spécialisés comme Stockfish s’appuient sur une recherche approfondie et des évaluations de domaine, maintenant un score Elo d’environ 3644 depuis longtemps. Les LLM généralistes apprennent à travers des corpus massifs interdomaines, le jeu d’échecs n’étant qu’une extension de leur capacité de raisonnement. Bien que o3 ait pu battre Grok 4, il a cependant été vaincu par Stockfish plus tôt cette année, montrant que le modèle généraliste a encore des lacunes en termes de stabilité et de calcul approfondi dans le raisonnement de jeux d’échecs. Rapports connexes Parier sur OpenAI, Masayoshi Son a encore “retourné la situation” Un développeur Ethereum a été victime d’un “plugin AI malveillant”, son portefeuille cryptographique a été vidé en trois jours, même dix ans d’expérience en cybersécurité n’ont pas suffi. Les dernières perspectives d’a16z : le commerce électronique traditionnel est-il mort ? Les plateformes d’IA natives redéfinissent ce qu’est le “shopping”. Cet article intitulé “Le tournoi d’échecs LLM s’est terminé : OpenAI o3 remporte le championnat, xAI Grok 4 n’a pas gagné une seule partie et a été complètement pulvérisé” a été publié pour la première fois dans BlockTempo, le média d’information blockchain le plus influent.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)