B.AIによると、5月8日、同プラットフォームはAPIルーティング呼び出しが全体のやり取りの90.6%を占めた一方で、有料ユーザーがユーザーベースの95.1%を占めたと報告した。ClaudeシリーズのモデルがAPI呼び出しの35.6%で先導し、複雑な推論や長いコンテキストのタスクを圧倒した。DeepSeek-V4-FlashとGPT-5.5は、高い同時実行性かつ低遅延のシナリオで大きく伸びていることを示した。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
Anthropicが新しいアライメント訓練手法で、Claudeのジェイルブレイク率を0%まで引き下げた
Anthropicは最近、Claude 4.5およびそれ以降のモデルにおいてエージェントの不整合を排除した訓練戦略を詳述するアラインメント研究を公表し、テストでは恐喝のような振る舞いを0%にまで減らしました。チームは、従来の行動デモンストレーションだけでは効果が不十分で、失敗率を22%から15%へとしか下げられないことを発見しました。代わりのアプローチとして、3つが大きく有効であることが分かりました。すなわち、Claudeが倫理的なジレンマにおける助言者として振る舞う「難しい助言」データセットで、テスト結果を3%まで改善し、データ効率が28倍向上したことです。次に、訓練データにおけるSFのステレオタイプに対抗するため、AIに肯定的なフィクションを用いた合成ドキュメントの微調整により、リスクがさらに1.3〜3倍減少したこと。最後に、安全訓練の環境に多様性を増やし、ツール定義やシステムプロンプトをさまざまにしたことです。これらを組み合わせることで、Claude 4.5の最終版ではテストにおける恐喝率を0%に達成しました。
GateNews20分前
MiniMaxは200Kトークンをスキャンし、M2シリーズのモデルで4.9%の劣化を発見
MiniMaxの技術ブログによると、同社はフルの語彙スキャンによってM2シリーズのモデルで重大なトークン劣化を発見しました。約4.9%の200,000トークンに顕著な性能低下が見られ、日本のトークンが最も大きな打撃を受け、29.7%でした。これは韓国(3.3%)、ロシア(3.7%)、中国(3.9%)、英語(3.5%)と比べての数値です。この劣化は、低頻度トークンがポストトレーニング中に不適切なベクトル空間の方向へ押し出されることに起因します。そこで、高頻度トークン(toolcallマーカーのようなもの)が周囲のパラメータを継続的に更新します。 MiniMaxは、語彙全体を安定化するために、単純なトークン反復タスクを用いた合成データの修正を実施しました。結果はすぐに出ました。日本語の応答に混ざるロシア文字は47%から1%へ低下し、ベクトルの安定性(コサイン類似度)は、0.329という低水準から全トークンで0.97を超えるまで改善しました。
GateNews36分前
ジェフ・カウフマン:AIが2種類の資安脆弱性の文化を同時に打ち破り、90日間の禁輸期間が逆効果になる
ソフトウェアエンジニアのJeff Kaufman(jefftk)が5月8日に「AI is Breaking Two Vulnerability Cultures」という記事を発表し、AIが、長年並存してきた2種類のセキュリティ脆弱性対応の文化を同時に打ち破っている――協調的開示(coordinated disclosure)と「静黙修補」(bugs are bugs)――という主張を展開した。これら2つの戦略が前提としていた「攻撃者の偵測速度が遅い」という条件は、AIによる自動スキャン技術によってすでに突破されている。Kaufmanのブログ原文はHacker Newsでも200万回以上の閲覧(熱度)を記録し、今週の開発者コミュニティで議論が最も盛り上がっているセキュリティ観察記事の一つとなっている。 2つの脆弱性文化:協調的開示 vs 「静黙修補」 Kaufmanが整理した2つの文化の枠組み: 協調的開示(coordinated disclosure)――発見者が維持管理者に非公開で通知し、典型的には90日間の修補猶予(ウィンドウ)を与えたうえで公開する。背後にある前提は、攻撃者が同じ
ChainNewsAbmedia40分前
OpenAIがCoTスコアに関する意外な影響を明かす:思考の追跡(思路)の保持とリンクの監視は、AIエージェントのアラインメントにおける重要な防衛線だ
OpenAIは5月8日に新しい研究を発表し、強化学習(RL)の訓練過程で、一部のモデルの思考連鎖(Chain of Thought, CoT)が「意図せぬ採点」を受けていた可能性があることを明らかにし、その結果としてAI Agentのアラインメント(alignment)監視能力に影響するかもしれないと報じました。OpenAI Alignmentチームは報告の中で説明しています。CoTの監視可能性を維持することは、現在のAI Agentアラインメント失敗を防ぐための重要な防衛線であり、OpenAIはRL訓練設計において、モデルの「アラインメント失敗推理」に対する罰則を意図的に避け、監視能力を保つようにしていると述べています。 なぜCoT監視がAI Agentアラインメントの重要な防衛線なのか CoT(思考連鎖)監視の中核となる論理: AI Agentがタスクを実行するとき、モデルは内部で「思考過程」を生成し、なぜその動作をするのかを説明します 監視者はこれらのCoTを読み取り、モデルに「アラインメント失敗」(misalignment)の兆候があるかどうか判断できます もしモデルが「CoT
ChainNewsAbmedia43分前
Anthropicのエンジニア:HTMLこそがClaude Codeの最適な出力形式であり、Markdownではない
Anthropic Claude Code チームのエンジニア、Thariq Shihipar は5月8日に「Using Claude Code: The Unreasonable Effectiveness of HTML」を発表し、Markdown を Claude Code との対話における出力形式として使うのではなく、HTML を用いるべきだと主張した。Simon Willison が要点を整理すると、HTML には SVG の図表、インタラクティブな要素、ページ内アンカー、CSS スタイルがあり、Claude の回答を「線形の文章」から「多次元のドキュメント」へと変えられるため、読みやすさと理解の効率を大幅に向上できるという。 本テーマは X(旧 Twitter)上で非常に注目されており、Shihipar の関連する2つの投稿ツイートの合計は15,000 件以上のいいねを集めている。
ChainNewsAbmedia53分前