Anthropic 經濟指數最新報告分析 2026 年 2 月 Claude 的使用情況,發現 Claude.ai 的使用場景持續多元化,平均任務薪資水準略有下降。本文源自 Anthropic 發布之研究報告,由動區動趨翻譯、編輯。
(前情提要:Anthropic 上線 AI 衝擊儀錶板:輸入職業,秒查你的工作被 AI 吃掉多少?)
(背景補充:CZ:美國加密交易費用太高了,邁向加密之都路上仍缺乏競爭)
本文目錄
Toggle
Anthropic 經濟指數運用我們的隱私保護資料分析系統,追蹤 Claude 在整體經濟中的使用情況。這是我們盡早理解 AI 經濟衝擊的努力之一,以便研究人員與政策制定者有充裕時間做好準備。
本期最新報告研究 2026 年 2 月的 Claude 使用情況,以我們前一份報告(採用 2025 年 11 月資料)所建立的經濟基本框架為基礎加以延伸。我們的樣本涵蓋 2 月 5 日至 2 月 12 日,距 Claude Opus 4.5 發布三個月後,並與 Claude Opus 4.6 的發布時間重疊。
我們首先記錄使用情況相較前份報告的變化:擴增型互動(即 AI 輔助使用者能力的協作互動)的比例在 Claude.ai 和 API 流量中均略有上升。在 Claude.ai 方面,使用場景趨於多元,前 10 大任務佔整體使用量的比例,低於 2025 年 11 月時的水準。由於這種多元化,Claude.ai 上平均對話所對應的任務薪資水準略低於前份報告。
接下來,我們聚焦於影響 Claude 對勞動市場及更廣泛經濟影響的一項重要因素:Claude 採用過程中的學習曲線。我們提供證據,顯示高資歷使用者已發展出得以更有效運用 Claude 能力的使用習慣與策略。確實,我們的資料顯示,更有經驗的使用者不僅會嘗試更高價值的任務,在對話中也更可能獲得成功的回應。
在第一章中,我們重新審視 2026 年 1 月發布的前一份經濟指數報告的研究發現。我們得出以下結論:
經濟指數的一項核心發現是:Claude 的早期採用極不均衡——在高收入國家使用更為密集,在美國境內則集中於知識工作者較多的地區,且僅涉及相對少數的專業任務與職業。
一個重要問題是,採用的不平等可能如何決定 AI 的收益流向何處、惠及何人。舉例而言,若有效使用 AI 需要互補性技能與專業知識(這是我們在前份報告中所主張的論點),且此類技能可透過使用與實驗加以習得,那麼早期採用的收益可能會形成自我強化的迴圈。
在第二章中,我們探討使用者如何塑造自身從 Claude 獲取的價值:他們如何將模型能力與當前任務相匹配,以及使用模式與成效如何隨平台使用經驗的累積而改變。
我們透過將每次對話對應至美國勞工統計局職業資訊網路(O*NET)中的任務,來研究 Claude 所執行的任務型別。這一對應採用隱私保護方法論,使我們能夠描述整體行為,而無需暴露個別對話記錄。
我們從兩個平台各抽取一百萬次對話樣本:Claude.ai(我們的消費者介面)以及第一方 API(我們的開發者平台)。
程式碼撰寫仍是我們平台上最常見的使用場景,與電腦及數學職業相關的任務佔 Claude.ai 對話的 35%。
在 2025 年 11 月至 2026 年 2 月之間,Claude.ai 的任務集中度有所下降:前 10 大 O*NET 任務在 2 月份佔對話的 19%,低於 11 月份的 24%。這一下降部分源於程式碼撰寫任務向第一方 API 遷移,Claude Code 的代理式設計將程式碼撰寫工作拆分為許多獨立的 API 呼叫。儘管程式碼撰寫在 API 中的比重有所增加,但各任務類別的整體分布仍相對穩定。
這一遷移僅能解釋集中度下降的部分原因。使用場景的組成也發生了變化:課業相關的對話比例從 19% 降至 12%,而個人使用則從 35% 攀升至 42%。課業比例的部分下降可歸因於某些地區的冬季學術假期。此外,2 月份也出現新使用者註冊加速的情況,帶來了更多休閒型使用者。9
Claude 職場任務的多元化建立在既有模式之上。我們的早期報告指出,49% 的職業已將 Claude 採用於至少四分之一的任務量;這一指標自前份報告以來幾乎沒有變動。新 O*NET 任務的出現速度也比早期明顯放緩。
自我們的第一份報告以來,我們將對話分類為五種互動型別——指令型、回饋迴圈型、任務迭代型、驗證型及學習型——並將這些型別歸入自動化和擴增兩大類。Claude.ai 的擴增型使用略有增加,主要受驗證及學習模式小幅增長驅動。在第一方 API 資料中,自動化型使用則大幅下降。
API 平台的電腦及數學任務集中度有所提升。自 2025 年 8 月以來,該類別在 API 中增加了 14%,同時在 Claude.ai 中減少了 18%。我們並行的勞動市場分析顯示,API 中的這一遷移可能預示著更直接的職業性衝擊。Claude.ai 中管理職業的任務比例從 3% 升至 5%,涵蓋分析型任務(如準備投資備忘錄)和客戶回應型任務。
我們以相關職業的美國工人平均時薪衡量任務的價值。Claude.ai 中的平均任務價值略有下降,從每小時 49.30 美元降至 47.90 美元,主要受簡單事實性查詢(體育、天氣)增加及程式碼撰寫任務遷移影響。我們的早期分析指出,Claude 的任務通常需要高於平均水準的教育程度,這些任務也對應著高於平均水準的薪資。
在兩份報告之間,幾項基本指標的變化反映了 Claude.ai 平均任務複雜度的下降。典型人工輸入所需的平均教育程度從 12.2 年降至 11.9 年;使用者也賦予 Claude 更多自主權;獨立完成任務的預估時長縮短了約 2 分鐘。與此同時,任務在沒有 AI 輔助的情況下完成的難度略有提升。
圖1:Claude.ai 與 API 平台前 10 大任務集中度的變化情況,顯示 Claude.ai 使用場景多元化而 API 集中度上升的趨勢
圖2:以相關職業美國勞工時薪衡量的 Claude 任務價值分布,顯示 Claude.ai 平均任務薪資從 49.30 美元略降至 47.90 美元
圖3:Claude.ai 與第一方 API 的任務類別分布比較,顯示程式碼撰寫任務從 Claude.ai 向 API 遷移的趨勢
隨著越來越多的任務遷移至 API,暴露於自動化的程度也隨之增加。API 工作流程主要採用指令型形式,人工介入極少。我們此前曾強調客服應用的普遍性——包括自動化付款和帳單支援——顯示客服代表面臨較高的暴露程度,可能加速職業變化。
兩種 API 工作流程在各樣本期間之間的頻率約增加了一倍:
我們在早期報告中指出,Anthropic AI 使用指數(已針對人口進行調整)在美國各州之間迅速收斂,初始採用率較低的州正在加速追趕。
當前資料確認收斂趨勢持續,但速度比我們此前觀察到的更慢。從 2025 年 8 月至 2026 年 2 月,前五名州的人均使用量佔比從 30% 降至 24%。自 2025 年 8 月以來,吉尼係數(Gini coefficient)有所下降,但收斂速度已放緩。我們更新後的預測現估計,所有州達到同等人均使用量需約 5 至 9 年,而早期估計為 2 至 5 年。6
在國際層面,情況恰恰相反:集中度有所提升,吉尼係數相應上升。人均使用量最高的國家如今佔整體使用量的比重更大,前 20 個國家的人均調整使用量已從 45% 上升至 48%。
圖4:美國各州 Claude 人均使用量的收斂趨勢,顯示前五名州佔比從 30% 降至 24%,收斂速度較前期放緩
圖5:各國 Claude 使用量的國際吉尼係數走勢,顯示全球不平等程度與前一報告相比有所加劇
本章探討兩個反映使用者如何部署和學習 AI 的使用特徵:模型選擇,以及更有經驗的使用者的使用模式。
第一項是模型選擇,揭示了對智慧需求的洞察。目前幾乎沒有關於多模型環境下使用者行為的既有研究,在這種環境中,使用者可以在速度、效能和成本之間進行取捨。Opus 在適當任務上的集中選擇,應能反映將更難、更高價值的任務分配給此一模型的行為。
第二項調查是按資歷劃分的使用情況,探討與使用者加入 Claude.ai 時間相關的差異,旨在揭示學習曲線。使用者在使用 Claude 的過程中會變得更加擅長嗎?使用模式會如何改變?我們發現了與「從做中學習」一致的證據:更有經驗的使用者在對話中有更好的成效,與 Claude 的協作更加深入,嘗試更有難度的任務,並將 Claude 更多地應用於多元化工作場景。
Claude 的模型系列——Haiku、Sonnet 和 Opus——在成本、速度和效能之間各有取捨。Opus 擁有最高的上下文限制,在複雜任務上表現卓越,但在 API 中每個 token 的成本也最高。一個具有成本意識且接近使用上限的使用者,會希望將 Opus 用於困難、高價值的任務,並為較簡單的工作選擇其他替代方案。這大致上與我們在資料中觀察到的情況吻合。3
在使用所有模型系列的付費 Claude.ai 使用者中,55% 的電腦與數學任務(如軟體程式碼撰寫)使用 Opus,相較之下教育類任務僅有 45%。
技術使用者可能認識到效能優勢,主動從預設的 Sonnet 切換。具有效率意識的使用者則可能將 Sonnet 用於例行工作,以避免耗盡使用配額。這些差異也可能反映出教育任務相對簡單,或學生群體對成本的敏感度較高。
更細緻的分析揭示了較高薪資職業任務與更多 Opus 選擇之間的相關性。以 Claude.ai 為例,軟體開發人員任務的 Opus 使用率為 34%,而家教任務僅為 12%。在控制其他因素後,平均時薪每增加 10 美元,Claude.ai 對話中 Opus 的佔比就增加 1.5 個百分點。第一方 API 流量對任務複雜度的敏感度約為前者的兩倍,任務價值每增加 10 美元,Opus 佔比增加 2.8 個百分點。實施程式化工作流程的使用者,相較於網頁介面使用者,可能有更多理由切換模型。
圖6:各任務型別的 Opus 模型選擇比例,顯示使用者傾向為薪資較高的技術性任務(如軟體開發)選用 Opus,而教育類任務的 Opus 使用率相對較低
圖7:職業薪資水準與 Opus 模型選擇率的相關性分析,顯示在 Claude.ai 中每增加 10 美元時薪,Opus 使用率提升約 1.5 個百分點,API 中的效應則約為兩倍
Claude 的第一個模型於 2023 年 3 月發布。此後的快速成長形成了多元化的使用者資歷分布——從自第一個模型發布就開始使用的使用者,到在測量期間前不久才註冊的使用者,皆涵蓋其中。Claude 資歷如何影響使用者體驗,是值得深入瞭解的課題。
高資歷使用者(在樣本期至少 6 個月前即已加入的使用者)展現出更多迭代式使用 Claude 的方式,而委派型使用則大幅減少。他們將 Claude 用於工作的比例高出約 7 個百分點,偏好所需教育程度較高的任務,任務分布也較不集中。前 10 大 O*NET 任務在其對話中佔 20.7%,相比之下,對照組為 22.2%。
高資歷使用者的任務分布,對應至每增加一年使用年資約需多一年教育程度的任務。同時,他們較少將 Claude 用於個人應用:在平台使用一年的使用者,其 38% 的對話屬於個人性使用,而最新使用者則為 44%。
這些模式可以有多種解讀。高資歷使用者代表一個自我篩選的群體,可能反映出固有特質——例如作為早期採用者的程式設計師,即為一個潛在的混淆因素。此外也存在存活者偏差:一年前註冊的使用者很可能認為 Claude 對他們有用,而那些沒有繼續使用的人則未被觀察到。
早期的分析記錄了低收入、教育程度較低的國家往往有較高的使用複雜度。這很可能由早期採用模式所解釋:任何國家或使用者群體中 Claude 的第一批使用者,很可能是在高價值技術應用中使用 Claude 的早期採用者;隨著採用率增長,越來越多的人加入,使用者基礎擴充套件到包含更多休閒型使用場景。
請求叢集分析揭示了最高資歷使用者中薪資均值最高的任務:AI 研究、git 操作、手稿修訂和創業融資。而最低資歷使用者中,則是:俳句創作、運動比分查詢、派對食物建議。
圖8:使用者資歷與任務分布的關係,顯示高資歷使用者(6 個月以上)偏向薪資較高、教育程度要求較高的工作型任務,而新使用者則集中於個人休閒類查詢
為了在控制變數的情況下進一步探索這些關係,我們使用帶有對話特定特徵的日誌層級資料進行分析。7 以對話成功率為結果變數、長資歷指標為預測變數的簡單雙變數迴歸顯示,長資歷使用者成功完成對話的機率約高出 5 個百分點。8
成功或許只是良好提示技巧的反映,而這種技巧是可以被模仿的。然而,若高資歷使用者從事的是本質上不同、基準成功率就更高的任務,那麼任務分配可能才是解釋這些發現的真正原因。
加入 O*NET 任務和請求叢集固定效應的規格,比較了執行相同型別任務的高資歷與低資歷使用者——例如,比較在「執行企業財務分析、估值和建模」叢集中的高資歷與低資歷使用者。固定效應吸收了叢集內高資歷使用者的平均優勢,產生了 3 個百分點的效應值。
最終規格進一步加入模型、使用場景和地理固定效應,探討高資歷使用者是否選擇了不同的模型、以不同語言溝通、維護著不同的應用程式,或從不同地區註冊。結果顯示高資歷使用者的效應略有提升,表明在控制所有這些因素後,成功率提升了 4 個百分點。
這些結果顯示,高資歷使用者在 Claude 對話中更為成功,且這一現象並非源於語言或所執行任務等簡單因素。
高資歷使用者與 Claude 的對話更為成功,這無法以他們使用的語言或所執行的任務等簡單因素來解釋。一個有力的解釋涉及在平台上學習能力的提升——這可能是隨著經驗積累而擴充套件的關鍵成功決定因素。
圖9:高資歷使用者對話成功率的迴歸分析結果,顯示在控制任務型別、模型選擇、使用語言及地理因素後,長資歷使用者的成功率仍高出 3 至 4 個百分點
本報告重新審視了 Claude 使用的主要指標,並首次分析了模型選擇與對話成功率。自 2025 年 8 月以來,第一方 API 使用日趨集中:前 10 大 O*NET 任務從佔流量的 28% 增至 33%。Claude.ai 的任務自 2025 年 11 月資料以來趨於多元化。美國地理收斂持續,但速度低於早期報告所示。採用率較低的國家面臨相對輕微的劣勢。
經濟基本框架使我們能夠追蹤 Claude 使用方式的縱向變化。課業相關的使用佔比有所下降,個人性對話則有所增加。Claude.ai 輸入的平均複雜度略有下降,對話顯示出較不複雜的輸入和較低的獨立完成時間估計。
Claude 整體上處理的是複雜、高價值的任務,這些任務在美國整體經濟活動中並不具代表性。隨著使用者群的擴大,薪資較低的任務類別佔流量的比例略有增加。以職業薪資為代理指標衡量的任務價值估計,在 Claude.ai 中自我們第一份報告以來有所下降,而在 API 中則有所上升。兩個平台都將複雜任務集中於最強大的 Opus 模型系列,這一轉變在 API 中更為顯著。
有經驗的使用者對 Claude 的使用更具協作性,更多地將其用於工作,嘗試更有難度的任務,並取得更好的成效。這與自動化使用在最進階、最成熟的使用者中佔主導地位的預期相反;相反地,有經驗的使用者表現出對迭代型使用的偏好。這些結果與「從做中學習」的論點一致:更多接觸 AI 能帶來更強的能力提取效果。
另一種解釋是,群組效應或存活者偏差可能是推動這些結果的因素。早期採用者可能具有高於平均水準的技術能力;持續使用 Claude 的使用者可能代表那些認為任務最適合使用 Claude 的人。經過嚴格控制的迴歸分析解釋了簡單的混淆因素(高資歷使用者帶來不同型別的任務);隨著時間推移,我們預計將能夠更好地辨別群組效應和存活者偏差與「從做中學習」之間的差異。
成功率的差異可能加劇勞動市場不平等。經濟學家長期以來認識到技能偏向型技術變革的潛在影響:這類創新會提高高技能工作者的薪資,同時壓抑其他人的薪資水準。本分析識別出這一現象可能正在發生的一個管道:傾向於高技能工作者的早期採用者,與後來的、技術能力較低的採用者相比,與 Claude 的互動更為成功。儘管兩個群體都面臨 AI 驅動的衝擊,但早期採用者在擴增階段是最大的受益者。
圖10:報告綜合分析的最終圖表,呈現 Claude 使用不平等、學習曲線效應與勞動市場影響之間的整體關聯