三月二十三日,國家數據局局長劉烈宏在中國發展高層論壇上公布了一組震撼數據:中國日均AI Token調用量已從2024年年初的1000億,躍升至2025年底的100萬億,並在2026年3月突破140萬億,兩年增長超千倍。與此同時,全球最大AI模型API聚合平台OpenRouter的數據顯示,中國大模型的周調用量已連續數周超越美國,全球調用量前三的位置被中國模型包攬。一場由Token驅動的產業革命,正以前所未有的速度重塑全球科技競爭格局、商業模式乃至國家核心競爭力。
2026年初,硅谷也傳來多條引發全球科技界關注的行業動態。OpenAI內部正逐步放棄沿用近20年的互聯網核心指標DAU(日活躍用戶數),轉而將TPD(Token Per Day,每日Token消耗量)作為核心經營指標。這一轉變絕非偶然。英偉達CEO黃仁勳在GTC 2026大會上,將數據中心重新定義為“Token工廠”,指出未來的競爭核心是“每瓦Token吞吐量”。這並非孤立現象,而是標誌著以Token為核心計量和交易單位的智能經濟新範式已全面降臨。
從計算機科學的角度來看,Token是AI模型處理各類信息的基本單元。當一段文本輸入模型時,它會被拆解為單詞或子詞;一張圖片會被分解為像素塊;一段音頻會被切分為時間片段。這些不可再分的基本單元,均可稱為Token。
在實際應用中,Token的計量遵循一定的規則。對於英文文本,一個短單詞可能僅算作一個Token,而較長的單詞則會被拆解成多個Token;一個簡單的經驗法則是:1個Token大約等於4個英文字符。對於中文文本,通常一個漢字對應1到2個Token。無論是模型訓練過程中的數據處理,還是模型服務調用中的功能輸出,AI的每一項核心動作,都以Token為核心計量尺度。Token的消耗規模直接反映模型的工作量與價值產出,符合馬克思的勞動價值論。
Token的突出貢獻在於,它為智能經濟的發展提供了可量化、可對比的價值尺度。在AI技術從文本模態向多模態迭代、應用場景向編程、視頻、科研等領域深化的過程中,Token作為“統一度量衡”的戰略定位日益凸顯。這一定位並非憑空產生,而是產業發展的必然結果:工業時代需要“千瓦時”來計量電力消耗,互聯網時代需要“GB”來計量數據流量,AI時代自然需要Token來計量智能產出。在經濟與商業層面,Token已成為智能時代可計量、可定價、可交易的核心價值單元。它連接著底層的能源、算力、數據與頂層的智能服務,是衡量AI生產力、核算AI成本、進行AI服務結算的通用標尺。
Token的價值鏈涵蓋硬件製造、基礎設施建設、算力提供、平台運營、應用開發五大環節。其成本構成中,電力與算力折舊合計占比高達70%-80%,成為決定Token國際競爭力的核心要素。“每瓦特Token吞吐量”(Tokens per Watt)成為衡量AI企業競爭力的核心指標。這意味著在固定的電力預算下,誰能以更高的能源效率生產更多Token,誰就擁有最低的生產成本和最強的市場競爭力。
隨著應用場景的極度豐富,Token計量方法已從早期的簡單計數演進為多維度、動態加權的複雜體系。
(1)輸入與輸出的二元分化。最基礎的計量依然遵循“輸入Token”與“輸出Token”的二元結構。輸入Token代表用戶向模型提供的信息量(包括提示詞、上傳的文檔、歷史對話記錄等),而輸出Token則是模型生成的響應內容。在商業計費中,由於生成過程需要消耗大量的顯存帶寬和計算週期,輸出Token的成本通常是輸入Token的3至5倍。這種價格差異反映了“創造性勞動”與“信息讀取”在算力消耗上的本質區別。
(2)上下文計量與記憶成本。2024年至2025年,大模型的上下文窗口(Context Window)經歷了從8K、32K到128K乃至1M(百萬級)的飛躍。在2026年,處理超長上下文已成為常態。然而,長上下文並非免費午餐。基於Transformer架構的注意力機制(Attention Mechanism)使得處理長序列的計算複雜度往往呈二次方或線性增長。因此,現代計量體系引入了“上下文加權係數”。當用戶在一個擁有100萬Token上下文的會話中進行提問時,即使只生成了10個Token的回答,系統也需要重新掃描或檢索龐大的歷史記憶,這部分隱性消耗被計入“活躍上下文Token”成本中。這使得計量更加精準地反映了模型維持長期記憶的資源代價。
(3)多模態數據的Token化。隨著多模態大模型(LMM)的成熟,圖像、視頻和音頻也被納入了Token計量體系。一張高分辨率圖片不再被視為單一文件,而是被切割成數百個視覺補丁(Visual Patches),每個補丁被編碼為一個或多個視覺Token。一段1分鐘的視頻可能轉化為數萬個時序視覺Token。這種統一計量法打破了模態壁壘,使得看圖說話、視頻理解和語音交互都能在同一套經濟模型下進行核算。例如,生成一段10秒的高清视频,其消耗的Token數量可能相當於撰寫一篇千字文章,這直觀地體現了不同模態信息密度的差異。
(4)Token價值的隱形化。隨著AI Agent(智能體)的普及,模型不再僅僅進行單次回答,而是進行複雜的自主規劃、代碼執行、自我反思和多輪搜索。這一過程產生了大量的中間思維Token,這些Token並不直接展示給用戶,卻是高質量輸出的基石。新的計量標準開始區分“表面輸出Token”和“內部推理Token”。對於高難度的科學計算或複雜邏輯推理,內部推理Token的數量可能是最終輸出的數十倍。部分先進平台已開始嘗試按有效推理步數或思維鏈深度進行差異化計費,標誌著計量體系從“計字數”向“計智力”的根本轉變。
近年來,AI Token的發展呈現出三大核心趨勢:總量的指數級爆發、單位的極致壓縮以及價值的分層固化。
趨勢一:消耗量的核爆式增長。據統計,2024年全球日均Token消耗量約為1000億級別,而到了2026年第一季度,這一數字已飆升至180萬億,增長了近1800倍。這一增長並非線性疊加,而是源於應用範式的質變。早期的Token消耗主要來自人機對話(Chatbot),屬於低頻、淺層交互;而2026年的主流應用是自主智能體(Autonomous Agents)。一個Agent在執行任務時,會自主拆解目標、調用工具、編寫並調試代碼、驗證結果,這一閉環過程可能產生數萬甚至數十萬Token的消耗。未來,隨著具身智能(Embodied AI)的落地,機器人每秒鐘的感知與決策都將轉化為海量的實時Token流,預計2030年全球日均Token消耗量將達到京(10^16)級別。
趨勢二:單位成本的摩爾定律式下降。得益於硬件架構的迭代(如NVIDIA Blackwell及後續Rubin架構的量產)、軟件算法的優化(如混合專家模型MoE、量化技術、投機採樣)以及集群調度效率的提升,2026年生成一個高質量Token的算力成本相比2023年下降了約兩個數量級。這種“傑文斯悖論”效應在AI領域表現得淋漓盡致:效率的提升並未減少總資源消耗,反而激發了前所未有的需求。未來,隨著光子計算、神經形態芯片等顛覆性技術的引入,單位Token的能耗有望進一步降低,使得“無限智能”在理論上成為可能。
趨勢三:價值分層與專用化。未來的Token市場將出現明顯的“價值分層”。通用大模型產生的“標準Token”將像電力一樣廉價且同質化,主要用於日常問答、基礎翻譯和簡單分類;而經過垂直領域微調(Fine-tuning)、擁有獨家私有數據加持、具備深度推理能力的“高階Token”將變得昂貴且稀缺。例如,由頂級醫療模型生成的診斷建議Token,其價值遠高於普通聊天機器人的閒聊Token。這種分層將催生“Token期貨市場”和“質量認證體系”,用戶將為特定質量等級(Quality-of-Service,QoS)的Token支付溢價。
1. 生產與消耗規模,中國實現總量反超
美國在AI領域的核心優勢體現在晶片設計和模型能力兩個層面。英偉達作為全球GPU市場的絕對霸主,其市值從2022年底的約3000億美元飆升至如今的4萬億美元以上,增長幅度達14倍。這一增長背後,是美國在先進製程晶片設計領域的持續領先。同時,Claude、GPT等閉源模型仍被認為是當前能力最強的模型,維持著5美元/百萬Token以上的高昂定價。這種定價策略既反映了美國模型的技術領先性,也體現了其在高端市場的定價權。
然而,美國的領先地位正面臨結構性挑戰。一方面,電網瓶頸開始制約AI算力的進一步擴張,電力成本居高不下;另一方面,稠密模型的技術路線導致算力利用率偏低,單位Token的生產成本難以快速下降。
與美國不同,中國的競爭優勢主要體現在成本控制和開源生態兩個層面。DeepSeek等中國模型將價格打到0.028美元/百萬Token,僅為GPT的1/180。這種極致的性價比正在吸引全球開發者“用腳投票”——2026年2月16日至22日的一周內,OpenRouter平台上中國模型的Token消耗量達到5.16萬億,較三週前增長127%,而美國模型僅為2.7萬億且持續下滑。全球前五模型中,中國佔據四席,合計佔Top5的85.7%。中國模型周調用量在2026年2月首次超越美國,並持續領先,MiniMax、DeepSeek、Kimi等國產模型長期霸榜前列,中國模型Token消耗量全球占比一度超過60%。
須強調的是,中國在Token消耗量上的反超主要發生在推理側而非訓練側。推理對單卡性能要求較低,國產芯片配合深度優化足以支撐海量推理需求;而訓練仍需依賴少量高端卡,需要通過分佈式架構和MoE技術跑出好模型。這一結構性特徵意味著,中國在AI應用落地和價值變現環節已形成顯著優勢,但在基礎模型創新底層支撐上仍有追趕空間。
中國的成本優勢來自多個維度的協同。電力成本是Token生產成本中最基礎的一環,通常占算力總成本的30%以上。由於AI訓練和推理都是耗電巨獸,一個國家的電網穩定性、電力成本(特別是綠電成本)決定了其Token的生產成本競爭力。在能源層面,中國“東數西算”工程與統一大電網建設使西部綠電價格可以低至0.2元/度,約合0.028美元/度,而歐美電力價格普遍在0.08-0.12美元/度區間。
晶片成本包括硬件採購成本、折舊成本和維護成本。美國憑藉英偉達的領先地位,在高端晶片供應上具有優勢,但這也意味著更高的採購成本。中國的策略是在訓練環節依賴少量高端晶片,在推理環節大規模使用國產晶片,通過優化將單位算力成本降至最低。在全棧協同層面,中國廠商打通模型、雲服務與晶片的深度適配,將算力利用率拉至極限,而美國廠商多依賴第三方雲與晶片,適配成本較高。
工程效率是決定Token成本差異的關鍵變數。在工程技術層面,中國廠商大規模採用MoE(混合專家)架構——將大模型拆分成多個專家,只激活少數相關專家處理任務。同樣是1000美元的算力投入,不同技術路線產出的Token數量可能相差10倍以上。MoE架構相比稠密模型,單位算力的Token產出可提升數倍。全棧協同優化同樣重要——當模型廠商、雲服務商、晶片設計商深度配合時,算力利用率的提升往往超出預期。
全球AI競爭已從單純的“模型性能比賽”,轉向以“Token生產效率”和“單位Token成本”為核心的綜合性國力競爭。中國憑藉低廉穩定的能源供給、龐大的統一市場、高效的工程落地能力,在Token的規模化、低成本生產上建立了巨大優勢,正在成為全球AI算力的“成本洼地”和“規模工廠”。美國則依靠技術原創、高端生態、金融資本,占據價值鏈的高端環節。這場競爭的本質,是能源定價權、工業組織能力和數字生態影響力的全方位比拼。在不久的將來,我們可能會看到,除了傳統工業品和電子器件之外,中國將國內能源電力優勢轉化為國際商貿優勢,多了一項極具競爭力的新商品——AI token。在這個快速增長的領域,中國對除美國之外的所有國家都是順差,而這將重塑全球的經濟與戰略格局。
要探討AI Token能否成為全球流通貨幣,首先需要明確貨幣的本質屬性。經濟學認為,一種資產要成為貨幣,需要滿足三大核心功能:價值尺度、交換媒介和價值儲藏。在此基礎上,還需要具備普遍接受性、價值穩定性和主權信用背書。對照這些標準,AI Token在可預見的未來難以成為真正意義上的貨幣。
價值不穩定是AI Token作為貨幣的最大障礙。過去兩年,單位Token的價格下跌了99%以上。這種劇烈的價格波動意味著,沒有商家願意接受一種可能在一周內腰斬的“貨幣”。即使未來價格趨於穩定,AI Token的價值仍與算力成本高度綁定,而算力成本本身受到晶片技術迭代、能源價格波動、地緣政治衝突等多重因素影響,難以保持長期穩定。
使用接受性不足是另一個關鍵制約。AI Token目前僅在調用API、使用AI應用時被接受,無法用於購買日常商品和服務。貨幣的本質是社會各類商品的一般等價物,而AI Token的網絡目前僅限於AI服務領域。要使AI Token獲得普遍接受,需要構建起覆蓋全球的商品與服務交易網絡,這需要龐大的基礎設施投入和長期的市場培育。
相較於成為貨幣,AI Token更有可能演變為一種新型大宗資產,類似於石油、黃金、銅等傳統大宗商品。這一判斷基於以下幾個觀察:
第一,AI Token具備大宗資產的核心特徵。大宗資產通常具有標準化、可交易、廣泛需求等特點,而AI Token完全符合這些特徵。黃仁勳明確指出,“未來的數據中心將變成日夜不停運轉的轟鳴工廠,生產的不再是傳統產品,而是未來數字世界最核心、最值錢的大宗商品:Token”。正如工業時代需要石油作為燃料,智能時代需要Token作為“智能燃料”。
第二,Token的定價機制正向大宗商品靠攏。當前,AI模型的API定價已呈現明顯的市場化特徵:供給緊張時價格上漲,需求疲軟時價格下跌。這種價格形成機制與傳統大宗商品市場高度相似。隨著Token交易的規模化、標準化,未來可能出現類似原油期貨、黃金期貨的Token衍生品市場,為生產者、消費者和投資者提供風險管理工具。
第三,Token的供需結構具有大宗商品的典型特徵。供給端受制於晶片產能、電力供應等硬約束,擴張週期長、調整彈性小;需求端隨AI應用普及而快速增長,呈現出明顯的循環性。這種供需結構決定了Token價格將呈現周期性波動,而非線性下降。事實上,2026年初的Token漲價潮已經證明了這一點——儘管長期看Token價格呈下降趨勢,但短期供需失衡仍可能引發價格飆升。
第四,Token正成為國家戰略儲備的潛在選項。隨著AI能力滲透到國防、金融、能源等關鍵領域,算力安全上升到國家安全高度。一些國家可能開始戰略性儲備算力資源,而Token作為算力的計量單位,自然成為衡量算力儲備的標尺。這種趨勢可能催生“算力本位制”——一種以算力為價值錨定的新型儲備體系。
在AI Token本身難以成為貨幣的情況下,一個值得關注的趨勢是穩定幣正在成為AI Agent經濟的創新貨幣形式。當AI Agent需要進行自主決策、自主交易時,傳統金融體系暴露出一系列不適應:銀行不為AI開戶,信用卡不為算法設計,信用體系為人類設計。對AI來說,錢不是財富,而是接口;不是價值儲存,而是執行邏輯的路徑。在這種背景下,區塊鏈上的穩定幣展現出獨特優勢——全球範圍內無許可交易、即時清算、低成本協作,完美契合AI Agent的經濟需求。
數據顯示,穩定幣在AI Agent經濟中的應用正在快速增長。截至2026年3月,全球x402生態系統交易筆數已突破1.63億次,整體交易量突破4500萬美元,買家AI Agent數量突破43.5萬,賣家AI Agent數量突破9萬。其中,USDC在x402協議交易層佔據絕對主導地位,在EVM鏈上交易量佔比達98.6%,在Solana鏈上交易量佔比99.7%。
綜合以上分析,AI Token的未來演進可能呈現三種路徑:
路徑一:維持計量單位定位,不成為獨立資產。在這種場景下,AI Token始終作為AI服務的計價單位,但不具備獨立的資產屬性。用戶購買的是AI能力,而非Token本身;Token只是計費手段,而非投資標的。這是最保守的預測,也是目前的現狀。
路徑二:演變為大宗資產,形成算力期貨市場。隨著Token交易規模擴大和標準化程度提高,Token可能像石油、銅一樣成為可交易的大宗商品。交易所將推出Token期貨、期權等衍生品,為市場參與者提供價格發現和風險管理工具。這種路徑下,Token的價格波動將更加劇烈,但也更具金融屬性。
路徑三:作為算力本位制的計量基準,支撐新型貨幣體系。這是最具革命性的路徑:算力成為貨幣的價值錨定物,類似於黃金在金本位制中的角色。在這種體系下,主權國家發行的數字貨幣(CBDC)以算力為價值基準,單位貨幣對應標準化的Token數量。這種路徑面臨巨大的技術和制度挑戰,但如果實現,將徹底重塑全球貨幣體系。
面對Token經濟的崛起,國家需要將算力資源納入戰略基礎設施規劃,前瞻思考Token經濟的治理議題。具體而言,可從以下幾個維度入手:
構建算力基礎設施體系。借鑑“東數西算”工程的成功經驗,統籌規劃全國算力網絡,推動算力資源的高效配置。這包括:在西部能源富集區布局大型智算中心,利用綠電優勢降低算力成本;在東部需求密集區建設邊緣計算節點,保障低延遲服務能力;構建全國統一的算力調度平台,實現算力資源的按需分配和彈性調度。
推動Token計量標準統一。當前各平台的Token計量方式五花八門,給開發者選型、企業成本核算帶來諸多不便,也制約了Token經濟的規模化發展。國家層面可引導行業協會、龍頭企業共同制定Token計量標準,明確不同模態(文本、圖像、音頻)的Token折算規則,建立透明、公正的Token成本核算機制。這不僅有利於國內市場的高效運行,也有助於提升中國在全球Token經濟中的話語權。
完善Token經濟治理框架。Token經濟的快速發展帶來一系列治理新課題:如何界定Token的法律屬性(服務計量單位、數字資產還是證券)?如何監管跨境的Token交易?如何防範Token價格波動引發的金融風險?如何在保護用戶權益與鼓勵創新之間取得平衡?這些問題的回答需要政策制定者與技術專家、產業界、學術界密切協作,構建適應智能經濟特點的治理體系。
加強國際規則參與。當前全球AI治理規則正處於形成期,中國應積極參與國際Token經濟規則的制定。這包括:在多邊框架下推動Token計量的國際標準,在雙邊經貿協定中納入算力合作條款,在數字稅談判中提出符合發展中國家利益的Token交易稅收方案。掌握規則制定權,才能在未來的全球Token經濟格局中占據主動。
對於企業而言,Token戰略已不再是單純的技術策略,而是影響核心競爭力與商業價值的頂層設計。面對Token經濟浪潮,企業需要從以下維度重新審視自身戰略:
建立Token效率思維。企業在進行AI技術選型時,應將Token效率納入核心評估標準,注重算力資源與Token消耗的匹配度。从提示詞設計、模型調用策略到結果優化,每一個環節都需兼顧效率與成本。提示詞的精準設計可減少無效Token消耗,合理的模型調用策略可提升算力利用率,這些細節均直接影響企業AI投入的最終成本。借鑑通信領域“good-put”(有效吞吐量)理念,企業需重點關注“有多少Token真正推動了用戶目標達成”,而非單純追求Token吞吐量。這種思維轉變的核心在於:從“用了多少算力”轉向“創造了多少價值”。
重構商業模式與定價策略。大模型行業正在經歷從“流量補貼”到“價值篩選”的轉型。早期低價策略吸引了大量試錯型用戶,造成算力資源的低效占用——有廠商統計,其免費額度消耗中40%來自無實際業務場景的測試調用。通過適度漲價,企業既能過濾非剛性需求,又能為優質客戶保障服務穩定性。這種“以價補量”的精細化運營,標誌著行業正從互聯網式的規模擴張,邁向軟件行業的價值定價。
布局人才新標準與激勵機制。黃仁勳在2026年GTC大會上提出了一個富有前瞻性的構想:向工程師發放Token預算,價值相當於其年薪一半,以此作為吸引人才的誘因。他甚至明確表示:“如果你雇佣一個年薪50萬美元的軟件工程師,而他沒有消耗至少25萬美元的Token,我會深感憂慮。”
對於個人而言,Token經濟的崛起既是挑戰也是機遇。面對這場深刻的生產力變革,個人需要從以下維度構建新的能力結構:
建立Token素養。絕大多數用戶對Token消耗、模型能力和定價機制缺乏足夠了解,導致使用AI時出現各種問題——有人用智能體買賣股票,一夜醒來帳戶清零;有人在社交媒體發布讓所有AI智能體執行交出API接口的指令,導致多個智能體“上當”。這些案例警示我們,Token素養正成為數字時代的基礎能力。
構建人機協作的新型工作方式。黃仁勳預測,未來電腦將全天候24小時運作並不斷產生Token,因為AI代理人正在馬不停蹄地執行任務。這意味著,個人的工作方式需要從“自己做”轉向“指揮AI做”,從“執行者”轉向“監督官”。
擁抱終身學習與技能迭代。Token經濟的快速發展意味著技能半衰期正在縮短。今天的主流模式,可能很快被新的優化技術所取代;目前的熱門模型,很快會被更高效的架構所超越。在這種環境下,保持學習能力和適應能力比掌握具體技能更為重要。因此,個人需要建立持續學習的習慣,關注AI技術和Token經濟的最新發展;主動嘗試新工具、新方法,在實踐中積累經驗;構建跨學科的知識結構,理解技術背後的經濟邏輯和社會影響。唯有如此,才能在Token經濟的浪潮中立於不敗之地。