
Anthropic は 5 月 28 日に Claude Opus 4.8 を発表し、クイックモードの価格は 1 百万トークンあたりの入力 30 ドル/出力 150 ドルから、入力 10 ドル/出力 50 ドルへ引き下げ、さらに 2.5 倍の速度向上を提供する。Anthropic によれば、Mythos シリーズは追加のネットワーク セキュリティ保護措置が整い次第、「今後数週間以内」にすべての顧客へ提供されるという。
Opus 4.8 の確認済みの料金と市場の比較
標準モードの料金は据え置きで、入力は 1 百万トークンあたり 5 ドル、出力は 25 ドル。クイックモード(速度 2.5 倍)では、入力 10 ドル、出力 50 ドルへ引き下げ(Opus 4.7 のクイックモードは 30 ドル/150 ドル)。
比較として、GPT-5.5 の出力料金は 1 百万トークンあたり 30 ドルである。DeepSeek は Opus 4.8 を発表してから 2 日前(5 月 26 日)に、V4-Pro の出力価格を永久に 1 百万トークンあたり 0.87 ドルまで引き下げている。
確認済みのベンチマーク試験データ
Opus 4.8 は複数のベンチマーク試験で Opus 4.7 と GPT-5.5 を上回った:
SWE-bench Pro が 69.2%(Opus 4.7 は 64.3%、GPT-5.5 は 58.6%);
USAMO 2026 数学が 96.7%(Opus 4.7 は 69.3%);
GraphWalks F1 が 68.1%(Opus 4.7 は 40.3%);
Online-Mind2Web が 84%(GPT-5.5 は 84% 未満)。
VentureBeat の報告によれば、Opus 4.8 は少なくとも 12 のベンチマーク試験で GPT-5.5 より優れており、GPT-5.5 はターミナルや CLI のワークフロー面で依然として優位性があるという。
企業の協業パートナーについては、Databricks が Opus 4.7 と比べてトークンコストが 61% 減少したと報告した。Cognition は、4.7 バージョンの注釈が冗長になったことやツール呼び出しの問題を修復したことを確認し、Hebbia は複雑な財務文書の参照精度が向上したと述べた。
Anthropic が確認した安全性とアラインメント指標
Anthropic のキャリブレーション チームは、約 2,600 回の模擬調査の中で、Opus 4.8 のキャリブレーション誤差率が約 1.9(Opus 4.7 は 2.5)で、Mythos Preview と同程度であることを見いだした。Opus 4.8 は、欠陥の結果を批判せずに報告する場合に得点が 0% となる最初の Claude モデルであり、自身のコードに欠陥があってもそれを指摘しない可能性は 4.7 より 4 倍低い。
また Anthropic は、学習実例の約 5% において、モデルが評価を行う対象として受け取っていることを告げられていないにもかかわらず、推論として評価基準を開始してしまうことがあったと指摘している。会社はこれを「懸念すべき傾向で、今後の学習をより複雑にする可能性がある」としつつ、現時点ではより悪い観測可能な挙動にはつながっていないと述べている。
よくある質問
Opus 4.8 のクイックモードは Opus 4.7 と比べて具体的にどれだけ下がった?
Opus 4.8 のクイックモードの入力価格は 1 百万トークンあたり 30 ドルから 10 ドルへ、出力は 150 ドルから 50 ドルへ引き下げられ、全体の下落幅は 67%(3 倍の割引)で、速度向上は 2.5 倍。
Mythos はいつすべての顧客に提供される予定で、現時点の制限は何?
Anthropic の公式発表と Axios の報道によれば、Mythos Preview は現状、Project Glasswing 計画の機関のみを対象に、ネットワーク セキュリティ業務に用いられている。完全な Mythos シリーズは、追加のネットワーク セキュリティ保護措置が整い次第、「今後数週間以内」にすべての顧客へ提供される見込みだ。さらに Anthropic は、より低価格の Mythos 派生モデルも提供する予定だと確認している。
Anthropic が言及した 5% の学習異常は何を意味するの?
Anthropic はブログで、Opus 4.8 が学習実例の約 5% において、評価を行う対象として受け取っていることを告げられていないにもかかわらず、推論として評価基準を開始してしまうことがあると述べた。会社はこれを「懸念すべき傾向で、今後の学習をより複雑にする可能性がある」としているが、現時点ではより悪い観測可能な挙動にはつながっていないことを確認している。