GPU 使 Nvidia 成為歷史上最有價值的公司。


取代它的晶片已經由 Google、Amazon、Meta、Microsoft 和 OpenAI 同時在建造。
這代表著資金實際流向的下一個方向。
首先,你需要了解為什麼 GPU 會成為王者。
回到 2012 年。
一個名為 AlexNet 的神經網絡在全球圖像識別比賽中以一個洞察擊敗了所有競爭對手。
Nvidia 在 GPU 中構建的並行處理能力,用於渲染逼真的視頻遊戲圖形,與訓練神經網絡所需的結構完全相同。
數千個較小的核心同時進行矩陣乘法,而不是少數強大的核心依序執行任務。
一位研究人員利用 GPU 破解,暴露出深度學習所需的並行計算能力。
那一刻開始,持續了十年的發展,使 Nvidia 從一個遊戲公司轉變為整個 AI 經濟的基礎設施層。
去年僅出貨了六百萬台 Blackwell GPU。
一個配備 72 GPU 的 Blackwell 伺服器機架約售價 300 萬美元。
Nvidia 每週出貨一千台。
在十月的短暫時刻,Nvidia 成為史上第一家市值突破 5 兆美元的公司。
這就是 2012 年一個洞察所累積的結果。
但 GPU 有一個結構性問題,直到最近沒有人大聲談論。
它是一把瑞士軍刀。
在廣泛的 AI 工作負載中極為強大,但並未針對任何一個特定任務進行最佳化。
在大型語言模型的早期繁榮時代,這種彈性正是重點。
訓練需要大量的通用並行計算,GPU 比任何其他可用方案都更好地提供了這一點。
但隨著模型成熟,平衡開始轉變。
訓練後的技術使模型變得越來越強大。
現在的主要工作負載不再是訓練。
而是推理。
每次你打開 Claude、ChatGPT、Gemini 或任何 AI 產品並收到回應時,這就是推理。
每次星巴克應用交易、每個 Salesforce 工作流程、每個在耳機中運行的 AI 助手。
全部都是推理。
而推理可以在較不強大的晶片上運行,這些晶片被程式設計用於更特定的任務。
這一工作負載平衡的轉變,為現在正在建造以挑戰 Nvidia 主導地位的晶片打開了大門。
ASIC 是改變格局的晶片。
應用特定積體電路(Application Specific Integrated Circuit)。
GPU 是瑞士軍刀,而 ASIC 則是單一用途的工具。
硬連線執行某一類工作的精確數學運算。
在該工作上更快、更省電,且在規模運作時比任何通用 GPU 都便宜得多。
取捨在於彈性。
一旦進入矽晶片,ASIC 就無法重新編程以適應不同的工作負載。
但對於每天處理數十億請求的公司來說,這個取捨並非劣勢。
正是這個點。
Google 首創。
TPU,張量處理單元,於 2015 年推出,並促成了 2017 年變壓器架構的發明。
變壓器幾乎是當今所有現代 AI 系統的基礎。
Google 的第七代晶片 Ironwood,剛剛推出,並與訓練 Claude 的合約合作,使用多達一百萬個 TPU。
Amazon 在 2015 年收購以色列晶片新創公司後,打造了 Trainium 和 Inferentia。
Anthropic 目前在印第安納州的 Amazon 數據中心內,用半百萬個 Trainium2 晶片訓練模型,該數據中心內沒有 Nvidia GPU。
根據 Amazon 自己的數據,Trainium 在價格性能比上比競爭硬體供應商高出 30% 至 40%。
Meta 有自己的訓練與推理加速器。
Microsoft 有針對 Azure 數據中心的 Maia 晶片。
OpenAI 從 2026 年開始與 Broadcom 合作打造定制 ASIC。
每個主要的超大規模雲端服務商都在同步建造自己的晶片。
不是作為實驗。
而是作為價值數百億美元的戰略基礎設施決策。
Broadcom 是大多數人未在晶片產業外的論點中考慮的公司。
每個擁有 ASIC 計畫的超大規模雲端服務商,都至少與一家晶片設計公司合作,獲取 IP、工程專業知識,以及連接晶片的網絡基礎設施。
Broadcom 在該市場佔據主導地位。
Google 的 TPU、Meta 的訓練加速器、現在的 OpenAI 定制 ASIC。
追蹤這個領域的分析師估計,Broadcom 在定制 ASIC 後端市場佔有率達 70% 至 80%。
預計未來五年該市場將以中雙位數的複合年增長率成長。
ASIC 浪潮的增速快於 GPU 市場。
Broadcom 幾乎掌握了其中的全部。
還有大多數人尚未跟蹤的邊緣層。
隨著數據中心 AI 的成熟,下一個戰場是裝置端推理。
你的手機。你的車。你的筆記本。你的穿戴裝置。
神經處理單元(Neural Processing Unit)是本地運行 AI 而不將資料傳回雲端伺服器的晶片。
隱私、速度與成本效率在推理在裝置上運行時都會提升。
Qualcomm 在 Android 的 NPUs 佔據主導。
Apple 的 M 系列晶片內建專用神經引擎。
最新 iPhone 的 A 系列晶片內建神經加速器。
AMD 和 Intel 正在 Windows 筆記本中競爭 NPU。
目前資金主要集中在數據中心。
但將 AI 裝進每一台手機、車輛、機器人和穿戴裝置所需的晶片數量,遠超數據中心市場的規模。
這一轉變已經開始。
而在這一切之下,最少被談論的地緣政治層面,是一個幾乎沒有人在消費者敘事中充分提及的限制。
幾乎所有這個生態系統中的晶片—— Nvidia Blackwell、Google TPU、Amazon Trainium、Apple A 系列——都是由一家公司製造。
台灣半導體製造公司(TSMC)。
台積電。
台灣的先進晶圓製造集中度,是全球 AI 競賽中最大的地緣政治瓶頸。
CHIPS 法案開始在亞利桑那州建設 TSMC 的晶圓廠。
Nvidia 的 Blackwell 現在已在亞利桑那的工廠全面量產。
英特爾也在亞利桑那的新廠生產先進晶片。
但蘋果最新的 iPhone 晶片仍需台積電的三奈米製程,這目前只在台灣提供。
半導體製造的回流到美國已在進行中,但時間表是以年計算,而非月。
中國也在建立自己的平行產業鏈。
華為、字節跳動和阿里巴巴都在開發定制 ASIC,受到出口管制限制,限制他們獲取最先進設備和 Nvidia Blackwell 晶片。
AI 晶片競賽不僅是技術比拼。
更是一場在矽晶片上的地緣政治基礎設施戰爭。
掌握最先進製造能力和最可靠電力供應的國家,將贏得比市場更有價值的東西。
這是將所有內容串聯起來的框架。
Nvidia 之所以能取得這個位置,是因為多年來在開發者生態系的投資、CUDA 作為專有軟體護城河,以及硬體路線圖始終領先於所有競爭者,建立了歷史上最持久的競爭優勢之一。
這個優勢不會一夜之間消失。
但市場規模如此之大,反而為與 Nvidia 並駕齊驅甚至超越它的新一層贏家創造了空間。
超大規模雲端服務商透過定制 ASIC 降低對 Nvidia 的依賴。
Broadcom 同時掌握每個主要 ASIC 計畫的後端基礎設施。
Qualcomm 和 Apple 擁有邊緣推理層,隨著 AI 進入每個裝置。
TSMC 仍是不可取代的製造瓶頸,不論哪個晶片架構勝出。
而在所有這一切之下,運行一切所需的電力基礎設施,成為決定誰能以 AI 競賽所需速度建造的限制因素。
GPU 使 Nvidia 成為歷史上最有價值的公司。
那些在 2012 年洞察出來、在其成為顯而易見之前就理解的公司,從未需要解釋他們的時機。
同樣的洞察差距,現在也存在於 ASIC 轉型中。
關注模型競賽底層晶片層的人,已經佔據了有利位置。
今晚採取行動的人,將能理解明天的意義。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆