Karpathy:AI 能力認知出現嚴重斷層,免費版與前沿 Agent 是「完全不同的產品」

鏈新聞abmedia

前 Tesla AI 總監、OpenAI 創始成員 Andrej Karpathy 於 4 月 9 日在 X 上發表長文,指出公眾對 AI 能力的認知正出現嚴重分裂。他認為,使用免費版 ChatGPT 的人與每天使用 Codex、Claude Code 等前沿 agent 工具的技術人員,實際上是在討論「完全不同的產品」,但雙方都認為自己看到的就是 AI 的全貌。

兩個世界,兩種 AI 認知

Karpathy 將目前的 AI 使用者分為兩個群體。

第一類人在去年某個時間點試用了 ChatGPT 免費版,便以此形成對 AI 的整體印象。他們看到的是模型的各種失誤 — 幻覺、搜尋結果離譜、語音模式連「該開車還是走路去洗車」這種簡單問題都搞砸。Karpathy 承認這些問題確實存在,但強調免費版與過時模型並不能代表 2026 年前沿 agent 模型的真實能力。

第二類人同時滿足兩個條件:付費使用最新的前沿 agent 模型(如 OpenAI Codex 或 Claude Code),並且在程式開發、數學、研究等技術領域專業使用。Karpathy 稱這群人正經歷高度的「AI 精神衝擊」(AI Psychosis),因為這些模型在技術領域的近期進步「只能用驚人來形容」— 你可以眼睜睜看著它們在一小時內解決原本需要數天甚至數週的程式架構問題。

為何進步集中在技術領域

Karpathy 解釋了 AI 能力提升為何在程式開發等技術領域特別顯著,而在搜尋、寫作、建議等一般用途上進步不那麼明顯。

原因有二:第一,技術領域提供了可驗證的獎勵函數(例如單元測試是否通過),這讓強化學習訓練得以有效運作;相比之下,寫作品質的優劣難以明確判定。第二,技術領域在 B2B 場景中更具商業價值,因此 AI 公司將最大比例的團隊資源投入在這些方向上。

兩個群體互相聽不懂對方在說什麼

Karpathy 總結道,這兩個群體正在「各說各話」。OpenAI 免費版語音模式搞砸日常問題,與 OpenAI 最高階付費版 Codex 花一小時重構整個程式碼庫或發現系統漏洞 — 這兩件事同時為真。

他在後續回覆中補充,有人向他提出一個觀點:OpenClaw 事件之所以引發如此大的社會關注,正是因為它讓大量非技術人員首次接觸到了最新的 agent 模型,而這些人此前只知道 AI 等於 ChatGPT 網頁版。

這篇文章 Karpathy:AI 能力認知出現嚴重斷層,免費版與前沿 Agent 是「完全不同的產品」 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Solana 與 Google Cloud 推出 Pay.sh,AI 代理可穩定幣付費

根據 Decrypt 於 5 月 6 日的報道,Solana 基金會與 Google Cloud 合作推出 Pay.sh 服務,允許 AI 代理使用 Solana 上的穩定幣按需支付 API 存取費用,無需傳統帳戶或訂閱;代理每次 API 呼叫僅需支付幾分之一美分,且無最低消費要求。

Market Whisper30分鐘前

Solana 基金會與 Google Cloud 推出 Pay.sh AI 支付閘道,支援 50+ 個 API 提供商

根據 Odaily,Solana Foundation 與 Google Cloud 共同推出 Pay.sh,這是一個 AI 付款閘道,能讓 AI 代理以按次請求的方式,使用鏈上穩定幣呼叫 API 服務,而無需傳統帳戶。該方案建立於 x402 協議之上,並支援 Tempo 與

GateNews1小時前

Anthropic 發布 10 個金融 AI 代理;FactSet 股票暴跌 8.1%

根據 Beating,Anthropic 最近發布了 10 個面向華爾街的全新 AI 代理,內建連接器與技能,用於高頻金融任務,包括撰寫簡報、估值審閱與合規工作流程。這些代理可作為插件部署於

GateNews2小時前

為 Gemini 測試 Google AI 代理「Remy」,競爭者開源 OpenClaw

根據 Business Insider,Google 正在 5 月 6 日測試一個名為 Remy、用於 Gemini 的新型 AI 代理。該代理目前僅提供給 Google 內部 Gemini 應用程式中的員工使用,能在整合 Google 其他的同時,代表使用者執行跨工作、學習與日常任務的行動

GateNews2小時前

Meta 計畫推出由 Muse Spark 模型驅動的 AI 助理,以在 5 月 6 日爭奪 30 億用戶並與 OpenClaw 一較高下

根據《金融時報》報導,Meta 將於 5 月 6 日打造一款高度個人化的 AI 助理,以與 OpenClaw 競爭,並由其全新 Muse Spark 模型提供動力。該工具將面向該公司超過 30 億名使用者,目前正進行內部測試。這款助理旨在讓使用者能夠建立 AI

GateNews2小時前

WorldClaw 和 WLFI 推出 WorldRouter,提供 300+ 個 AI 模型的存取權,成本降低 30%

根據 Foresight News,AI Agent 作業系統 WorldClaw 已與川普家族加密貨幣計畫 WLFI 合作,推出 WorldRouter。該平台讓使用者可透過單一帳戶存取超過 300 個主流 AI 模型,費用約比各自模型低 30%。

GateNews2小時前
留言
0/400
暫無留言