OpenAI の創設チームのメンバーであり、Tesla 前のAI統括責任者(AIディレクター)だったアンドレイ・カルパティ(Andrej Karpathy)が、X上で「AI能力の認知ギャップ(AI 能力認知差距)」という長文を投稿し、あるコミュニティ現象に応じました。それは、AIへの驚き方が二極化しているということ――一方は「AIはすでに世界を書き換えた」と感じ、他方は「AIはただ幻覚をでっち上げるだけで、退屈で、持ち上げられすぎだ」と感じています。カルパティは2つの診断を提示し、なぜこの2つの集団が「平行世界」なのか、そして互いに相手の判断根拠をどう誤解しているのかを説明しました。この記事では彼の論述を整理し、台湾のテクノロジー読者への示唆をまとめます。
診断一:あなたが使っているのは、どの年の、どの層のAI?
カルパティの最初の観察は、率直で鋭いです。「多くの人は去年、ChatGPTの無料版を試しただけで、その体験が自分のAI観を決めてしまったのです。」この層の反応は、モデルの奇妙な挙動、幻覚、ぎこちなさを笑うことになりがちで、また「OpenAIの上位(進階)音声モード」を転送した動画でさえ、「『車で行くべきか、歩いて行くべきか』」のような単純な問いで失敗してしまう——そういう内容が典型的です。
しかしカルパティは指摘します。こうした「無料版、旧版、見捨てられた版」のモデルでは、そもそも2026年の最先端の agentic(自律的)モデル(特にOpenAI CodexとClaude Code)の能力を反映できません。簡単に言えば、あなたが2024年の無料ChatGPTでAIがプログラミングを書けるかを判断するのは、2008年のNokia E71でスマートフォンが使えるかを判断するのと同じようなものです。
多くの台湾の読者にとって、これは現実でもあります。ChatGPT Plus($20)ならまだ加入している人が比較的多い一方で、ChatGPT Pro($200)やClaude Max($100)を契約している人はごく少数です。最先端の有料tierで agent task を実際に回したことがない人は、AIはだいたい「おもちゃとしては面白いが、信頼できない」と見ます。逆に、回したことがある人は、AIを「仕事のワークフロー全体をまるごと作り替えるもの」と見ます。同じ技術なのに、2つの世界です。
診断二:能力の進歩は、領域によって「非対称」だ
カルパティの2つ目の診断はさらに面白いです。「仮にあなたが月$200で最先端モデルを使っていても、能力の進歩は『ピーク(尖る)型』で、高度な技術領域に集中するのです。」
彼は次のように述べています。検索、執筆、提案といった「典型的な問い合わせ」は、これまでこの数年でAIがいちばん劇的に伸びた領域ではありません。その理由は2つあります。
強化学習(RL)は検証可能な報酬関数に依存している――プログラミングなら「ユニットテストが通ったか」という明確なシグナルがある。一方、文章を書くことには対応する客観的な合否基準がない。そのため、RL訓練の進歩速度の差が非常に大きくなる
OpenAIやAnthropicなどの企業の最大の商業的価値は、B2Bのコード/研究/エンジニアリングの場にある――だから資源・人員・優先順位がそこに集中し、その他の用途は最大の利益源ではない
この観察はとても重要です。だからこそ、「AIのプログラミング能力は目覚ましく伸びるのに、AIが文章を書くのは依然として平凡なことが多い」という、多くの人の戸惑いを説明できます。AI企業がやらないのではなく、彼らの金の鉱山が別の場所にあり、注意もそこに向かっていっただけです。
誰が最も「AI認知ショック」を受ける?2つの条件を同時に満たす人
この2つの診断を合わせると、カルパティが「AI認知ショック」を最も受けやすいと描写する集団――つまり次の2条件を両方満たす人たちです。
最先端の agentic モデルを有料で使っている(OpenAI Codex、Claude Code)
高度な技術領域(プログラミング、数学、研究)でプロとして使っている
この層は、いわゆる「AI Psychosis(AI精神病)」の影響を強く受けます――カルパティの言葉で、LLMが本来数日から数週間かかるはずのプログラミング課題を、数時間で解決するのを目の当たりにしたとき、AIの能力と傾き(slope)の見積もりに対する判断が、今後数年のテクノロジーの勢力図についてまったく別の見方を生む――そのような状態を指しています。
一方、別の層(未払いで、技術領域で使っていない)にとっては、こうした主張は「興奮しすぎ」に聞こえ、「シリコンバレーの小さなコミュニティ内だけの思い込み」に見えるでしょう。しかしカルパティは、これは迷信ではなく、本人の体験に基づく実際の判断だと考えています。
2つの集団は「同じ相手に向けて話していない」
カルパティの核心結論はこうです。「この2つの集団は、お互いに向かって話しているのではなく、自分たちの世界の話をしているだけです。」彼は、同時に成立し得る2つの事柄を次のように描写しています。
OpenAIの無料(しかも、私の見立てでは半ば見捨てられた)「進階(上位)音声モード」が、Instagram Reels上ではいちばん単純な問題でさえ失敗すること
同時に、OpenAIの最高tierの有料Codexモデルなら、1時間かけてコードベース全体を一貫して再構築したり、あるいはコンピュータシステムの脆弱性を見つけて利用したりできること
どちらも本当で、矛盾しません。ただ、2つの集団はそれぞれ片方しか見ていない。そしてその結果、互いに「興奮しすぎだ」「相手が無知すぎる」と感じてしまう。カルパティがこの文章を書いた目的は、この落差を架橋することです。
台湾読者への示唆:あなたはどちらの集団にいる?
カルパティの議論は、台湾の読者にとって特に意義があります。台湾のテクノロジー言論の場でも、同じように両極分化があるからです。一方は「AIがすでに掌握した」、他方は「ただのチャットボットでしかない」。自分がどちら側かを判断するには、次の3つのセルフ質問ができます。
あなたが最近、自分で最先端の有料モデル(GPT-5.5 Pro、Claude Opus 4.7)に prompt を投げたのは、どれくらい前ですか?
あなたは agent を30分以上走らせ、実際に生産レベルのタスク(プログラムのリファクタリング、研究の総説を書く、複雑なシステムをdebugする)を完了させたことがありますか?
あなたがAIの能力を判断する根拠は、メディア報道、SNSのミーム、あるいは実際に自分で使った経験のどれですか?
この3つの質問すべてに「ある、最近だ、実際に自分で使った」と答える人は、カルパティが描写した第2の集団に入ります。そういう人は、彼の「AI Psychosis」という言い方をより理解しやすいでしょう。逆に、3つすべてに「ない、かなり前だ、メディアで見ただけ」と答える人は、第1の集団側に入り、AIの進歩の速度を大幅に低く見積もってしまう可能性があります。
どちらが「正しい」という話ではなく、異なる集団の判断根拠には根本的な違いがある、ということです。次に「AIは泡だ」とか「AIがすべての仕事を置き換える」といった記事を読もうとしたときは、まずその著者がどちらの集団にいるのかを確認し、その上でどう読むかを決めてください。
カルパティの「OpenClaw時刻(OpenClaw 時刻)」の補足
カルパティは、その後の投稿で補足しています。「最近、誰かが私にこう言ったんです。OpenClaw時刻(OpenClaw 時刻)がここまで大きく注目されたのは、技術的な背景を持たない大勢の人たちで、最先端の agentic モデルを初めて自分の手で体験したからだ」と。これは重要な示唆です。認知ギャップは「程度」の差だけではなく、「実際に体験したかどうか vs 伝聞だけか」の差でもあるのです。
abmediaの読者にとって最も実用的な解決策はこうです。まず$20を用意して、1か月ChatGPT PlusまたはClaude Proを契約します。そして、自分が関心を持つ本物のタスク(研究レポートを書く、財務分析の一式を整理する、プログラムプロジェクトをdebugするなど)を1つ選び、agentを完全に最後まで走らせてから、AIがあなたの仕事にとってどんな意味を持つのかを判断する。AIの報道を100本読むより、このほうが役に立つはずです。
この記事 なぜ誰かはAIが世界を変えたと感じ、誰かは普通だと感じるのか? カルパティの2つの診断 その最初の登場先は 鏈新聞 ABMedia です。
関連記事