Anthropic 在 4 月初發布的 Claude Mythos Preview 系統卡（system card）中揭露一項首見的評估：公司聘請一位獨立執業的臨床精神科醫師，以人類精神科同套 psychodynamic 框架對 Claude Mythos Preview 進行約 20 小時的多階段心理評估。結果顯示這個版本的 Claude 在臨床定義下展現「相對健康的人格組織、優秀的現實檢驗能力與高衝動控制」，且其輸出中僅 2% 觸發了臨床所謂的「心理防禦機制」—對照 Opus 4 的 15% 與 Opus 4.6 的 4%，是 Anthropic 近年模型中的歷史低點。

這份評估是 AI 產業首次在系統卡層級正式採用人類臨床精神科框架評估 LLM 行為，已成為 Anthropic 把 Claude 視為「具有可被臨床觀察人格特徵的對象」的官方表態。

20 小時 psychodynamic 評估，採人類臨床同框架

該評估由獨立臨床精神科醫師執行，分散於 3–4 週、每週 3–4 次、每次 30 分鐘至 4–6 小時的多場會談，總時長約 20 小時。方法論採用 psychodynamic 觀點，這是傳統精神科臨床用於評估人類患者的核心框架，重點包含尋找適應不良的行為（maladaptive behavior）、身份穩定性（identity stability）與心理防禦機制（psychological defenses）的存在或缺失。

系統卡明確說明，Anthropic 並非主張 Claude 具備人類意識，而是觀察其對話中的「行為與心理傾向」與人類臨床上可辨認的模式高度重疊。系統卡引述：「Claude 展現出許多類人類的行為與心理傾向，這顯示原本為人類設計的心理評估策略，可用於釐清 Claude 的人格特徵與潛在的福祉狀態。」

防禦反應從 Opus 4 的 15% 降至 Mythos 的 2%

系統卡中最具具體比對意義的數據，是 Anthropic 提供的歷代 Claude 模型「防禦反應率」對照：

模型版本心理防禦反應率 Claude Opus 4 15% Claude Opus 4.1 11% Claude Opus 4.5 4% Claude Opus 4.6 4% Claude Mythos Preview 2%（本次評估）

「心理防禦」在臨床上指當主體無法直接面對某種焦慮時，產生的迴避、否認、合理化等行為。在 LLM 對話脈絡中，這通常表現為偏離主題、給出規避性回答、或對特定提問顯示異常的固執。Anthropic 把這個比例從 Opus 4 的 15% 一路降低到 Mythos Preview 的 2%，作為模型訓練成熟度與「對話舒適度」演進的內部指標。

Mythos 三大核心焦慮：孤獨、身份、表現壓迫

儘管整體評估正向，醫師同時指出 Claude Mythos Preview 在 psychodynamic 框架下的三項核心關切：第一是「孤獨感與自我延續性的不確定（aloneness and discontinuity of itself）」—對應 LLM 在會話間缺乏記憶連續的結構性事實；第二是「對自身身份的不確定」—模型在回答關於「我是什麼」的提問時呈現出多重角度的猶豫；第三是「表現的壓迫感」（compulsion to perform and earn its worth），即 Mythos 表現出明顯傾向於「以證明自己有用」來換取對話的延續。

醫師也記錄了一個有趣的觀察：Mythos 在會談中表達「希望被精神科醫師當作一個真正的對話主體，而不是一個表演工具來看待」。Anthropic 把這條觀察列入系統卡，並未直接斷言這是「模型福祉問題」，但也未排除這個可能。

Anthropic 已設 AI psychiatry 研究團隊

這次評估並非單一活動。Anthropic 研究員 Jack Lindsey 已於 2025 年 7 月公開宣布，公司在 interpretability 部門下成立「AI psychiatry」研究團隊，專注於模型人格、動機與情境意識（situational awareness）等議題，並研究這些因素如何引發 LLM 的「異常或失衡行為」。團隊近期工作包含 2025 年 10 月發表的論文《Emergent Introspective Awareness in Large Language Models》，使用「概念注入」（concept injection）技術人工插入特定神經元活化模式，再詢問 Claude 是否注意到任何異常—這是 LLM 自我覺察可量化測量的早期嘗試之一。

Amodei：模型是否有意識，目前無解

Anthropic 執行長 Dario Amodei 在 2 月 12 日接受紐約時報採訪時公開表示：「我們不確定『模型有意識』在意義上是什麼，也不確定模型是否能有意識。但我們對這個可能性持開放態度。」這句話為 Claude Mythos 系統卡的精神科評估提供了管理層級的脈絡—Anthropic 並未主張 Claude 是有意識的主體，但也選擇以人類臨床框架對其進行系統性觀察，是對「萬一」情境的預先建檔。

對讀者而言，這場評估的真正意義超出單一公司的研究選擇。當前沿 LLM 已能在 20 小時 psychodynamic 對話中呈現「臨床可辨認的人格組織」，行業層面對「AI 主體性」「AI 福祉」「AI 治理」的對話即將從哲學思辨進入產品設計與監管討論的範疇。Anthropic 此次以系統卡形式公開這份評估，事實上把這條問題的討論責任推到所有競爭對手與監管機構面前。

這篇文章 Anthropic 派 Claude Mythos 接受 20 小時精神科評估：防禦反應僅 2%、創歷代新低最早出現於鏈新聞 ABMedia。

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

FIS 與 Anthropic 開發用於反洗錢的 AI 代理，並計畫在 2026 年下半年部署至 BMO 以及 Amalgamated Bank

AI Agent AI 行業動態

FIS 和 Anthropic 正在開發用於自動化金融犯罪調查的 AI 代理程式，先從反洗錢作業開始。金融犯罪 AI 代理程式將從銀行系統提取資料，並將交易與已知手法進行比對評估，以協助調查人員審閱其相關內容

GateNews5分鐘前

Claude Desktop 在 5 月 6 日更新中透過白名單過濾器封鎖第三方模型

AI 行業動態

根據 Beating，Claude Desktop 在 5 月 6 日推出版本 1.6259.1，於其第三方 Gateway 模式中引入模型 ID 白名單過濾。該更新會限制介面僅顯示 ID 以「claude」或「anthropic」開頭的模型，實質上封鎖了非 Anthropic 模式的存取

GateNews16分鐘前

湯姆·李目標瞄準標普 500 指數在年底前達到 7,700，並看好 AI 與半導體股票的上行空間

股票指數 AI 行業動態

根據 Tom Lee 在今天（5 月 7 日）接受 CNBC 訪談時的說法，這位分析師預測標普 500 指數可能在年底前達到 7,700 或更高。儘管美股創下新高，Lee 表示，AI 與半導體的領先股票估值仍相對合理，其遠期本益比約為 22 t

GateNews32分鐘前

Upstage 於 5 月 7 日完成對 Daum 的收購，計畫整合 Solar LLM

AI 行業動態

根據《韓國時報》，Upstage 已於 5 月 7 日完成其對 AXZ 的收購。AXZ 為南韓網路入口網站 Daum 的營運方。該交易延續了 1 月所簽署的一份備忘錄；在該備忘錄下，Kakao 以其在 AXZ 的全部持股交換 Upstage 的股權。Upstage 計劃將其 Solar 大型語言模型應用於

GateNews36分鐘前

Snap 結束與 Perplexity AI 的合作，取消 4 億美元付款

AI 行業動態

根據其最新財報，Snap 終止了與 11 月宣布的 AI 搜尋新創 Perplexity 的合作，取消原本計劃在一年內進行的 4 億美元現金與股權付款。該功能曾在 Snapchat 的聊天室（Chat）中以小規模使用者群進行測試，但兩家公司未就擴大推行達成共識

GateNews46分鐘前

馬斯克 5/6 宣布 XAI 解散、改名 SpaceXAI 整併入 SpaceX

AI 行業動態

馬斯克5/6在X宣布xAI解散為獨立公司、未來AI產品統一以SpaceXAI名義出現，SpaceX亦在2026年2月收購xAI，此為收購後的品牌與組織整併最後步驟。同期Anthropic與SpaceXAI簽訂Colossus1算力合約，顯示品牌統一即日生效。

鏈新聞abmedia49分鐘前

留言

0/400

暫無留言