Selon The Information, en citant des mémos internes de Tencent et des sources, des employés de Tencent ont utilisé Claude Code, d’Anthropic, pendant la phase de post-formation de Hy3, le dernier grand modèle de langage de l’entreprise, malgré l’interdiction explicite d’Anthropic des services commerciaux aux entreprises chinoises, invoquant des inquiétudes liées à la sécurité nationale.
Hy3 présente une architecture de type mixture-of-experts avec 295B paramètres. Durant la phase RLHF (reinforcement learning from human feedback, apprentissage par renforcement à partir de retours humains), le personnel de Tencent a servi d’évaluateurs humains, avec une utilisation plafonnée à des milliers de tokens par personne. Des mémos internes ont fourni des guides d’installation de Claude Code. Des employés de Tencent ont utilisé Claude Code pour générer des exemples de référence de haute qualité destinés à noter des sorties de modèle anonymes, plutôt que ce qu’ils ont décrit comme de la distillation. Un porte-parole d’Anthropic a déclaré que l’entreprise surveille activement les attaques de distillation, mais n’a pas abordé directement l’utilisation de Claude Code par Tencent.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Questions de la communauté : Biais idéologique dans les modèles d’IA grand public, le 4 mai
D’après BlockBeats, le 4 mai, un utilisateur de la communauté IA sur X, Freeze, a remis en question le fait que des modèles d’IA grand public, dont ChatGPT, Claude et Gemini, présentent un biais systématique en étant moins alignés sur des positions conservatrices sur des sujets tels que le genre, l’immigration et la criminalité. L’utilisateur a suggéré que, comme l’IA
GateNewsIl y a 18m
Cerebras prévoit une introduction en bourse (IPO) à $4B au Nasdaq, et démarre une tournée de présentation le 4 mai à 115 $ à 125 $ par action
Selon Reuters, le fabricant de puces IA Cerebras Systems a lancé son roadshow pour une introduction en bourse le 4 mai en vue d'une cotation au Nasdaq sous le ticker CBRS. La société prévoit de fixer le prix des actions entre 115 dollars US et 125 dollars US et pourrait lever jusqu’à US$4 milliard de dollars à une valorisation d’environ 40 milliards de dollars. Il s’agit de la deuxième
GateNewsIl y a 34m
L’IA fait progresser le PIB des États-Unis de 75% au T1, et les cinq principaux géants pourraient augmenter leurs dépenses en capital à plus de 1,1 billion de dollars d’ici 2027
Morgan Stanley relève de nouveau ses prévisions de dépenses d’investissement (capex) pour les cinq plus grands géants du cloud aux États-Unis : environ 805 milliards de dollars en 2026, environ 1,116 billion de dollars en 2027, et des dépenses en 2026 comparables à celles de 2025 hors secteur technologique. David Sacks estime que le capex lié à l’IA contribue à hauteur d’environ 2,5 % au PIB, et qu’il pourrait dépasser 3 % l’an prochain, étant perçu comme un nouvel moteur de l’économie américaine.
ChainNewsAbmediaIl y a 1h
Pour rattraper la vague des IPO de SpaceX, OpenAI et Anthropic, le Nasdaq et le S&P assouplissent leurs critères
Le Wall Street Journal indique que, pour préparer des IPO de SpaceX, OpenAI, Anthropic et d’autres, le S&P et le Nasdaq assouplissent les critères d’inclusion des valeurs. Le S&P réduit la période d’observation des nouvelles actions à 6 mois, ou accorde une dispense du seuil de profit ; le Nasdaq 100 lance une intégration rapide, et les IPO géantes peuvent être ajoutées à l’indice dès le 15e jour de cotation. L’inclusion se fera désormais selon la capitalisation boursière totale, en supprimant l’exigence de flottant minimum, et en adoptant une pondération dynamique. Des experts doutent que cela puisse amplifier les risques liés aux valeurs à la mode et fausser la formation des prix en cas d’insuffisance de découverte des prix.
ChainNewsAbmediaIl y a 1h
L’ASX met en garde les entreprises contre l’exagération de l’impact de l’IA le 4 mai
Selon Bloomberg, le 4 mai, l’opérateur de la bourse australienne ASX a averti les entreprises de ne pas surestimer l’impact de l’intelligence artificielle sur leurs activités. La directrice de la conformité de l’ASX, Lucinda McCann, a déclaré que la bourse surveillait les « ramping » ou les allégations visant à faire monter les cours des actions
GateNewsIl y a 1h
Megazone Cloud s’associe à AWS pour un programme de formation à l’IA en Corée du Sud
Megazone Cloud, une entreprise sud-coréenne de services cloud, a été sélectionnée par Amazon Web Services le 4 mai comme partenaire des opérations pour AWS Agentic AI GameDay en Corée du Sud, indique l’annonce de l’entreprise. Le programme est un événement de formation pratique mené par le Centre d’innovation en IA générative d’AWS,
CryptoFrontierIl y a 2h