輝達開放AI長期夥伴Deepinfra獲1.07億美元B輪融資建立「代幣工廠」

2026-05-10 00:04:08

人工智慧新創 DeepInfra 宣佈完成 1.07 億美元 B 輪融資，由 500 Global 與 Google 早期工程師 Georges Harik 領投，輝達 (NVIDIA)、Samsung Next 及 Supermicro 等策略投資者跟投。據官方消息透露，本次注資將用於擴展全球資料中心容量，解決當前人工智慧應用從「模型訓練」轉向「大規模推理」時所面臨的運算成本以及效率瓶頸。

AI 推理需求激增成為企業部署關鍵瓶頸

人工智慧邁向商業化，企業的工作負載重心已發生顯著位移。DeepInfra 觀測到自 A 輪融資以來其平台處理的 Token 量增長達 25 倍，顯示出 Inference (推理) 已成為驅動企業人工智慧負載的主力，當前開源模型效能已能與專有系統媲美，大幅降低創新門檻，然而隨之而來的自主智慧體（Agentic Systems）應用，單一任務可能需觸發上百次模型，由於傳統通用型雲端平台非依據推理需求所設計，導致企業面臨營運成本過高與延遲不可控等挑戰，使推理成為工作負載的系統約束。

垂直整合堆疊優化代幣經濟效能

DeepInfra 採取垂直整合策略，主張高效能推理必須透過硬體、網路與軟體的協同設計達成，該團隊過去具備開發全球通訊應用 imo 營運 2 億用戶分散式系統的經驗，目前已在美國創立八個 GPU 基礎設施；相較於向第三方租用容量的服務商，DeepInfra 擁有從晶片層級到 API 介面的完整堆疊控制權。這種設計使其能針對「始終在線」的代幣生成任務進行優化，確保在執行智慧 AI 工作負載時，能提供比通用雲端環境更佳的可預測性延遲。

Deepinfra 為輝達長期的開放 AI 生態夥伴

Deepinfra 為 NVIDIA 開放 AI 生態系的早期基礎設施合作夥伴，支援 Nemotron 模式、NemoClaw 智慧體架構和 NVIDIA Dynamo 推理軟體。 Blackwell GPU 的早期部署以及即將推出的 Vera Rubin 與 Dynamo 的集成，將將使推理成本效益提升高達 20 倍。

Deepinfra 提供具備競爭力開源模型

在成本控制方面，DeepInfra 透過優化的硬體運作超過 190 個開源模型，試圖提供市場極具競爭力的價格。以開源推理模型 GLM-5 為例，其混合定價為每百萬代幣 1.24 美元，低於產業平均值約 20 %。針對需要大量內部代幣運算的「思考模型」，該平台開發了快取機制，對重複輸入的靜態文字提供折扣定價，能有效降低多輪對話與檢索增強生成（RAG）管線的成本。為滿足企業端對安全性的要求，DeepInfra 提供與 OpenAI 相容的 API 並承諾零資料保留，同時通過 SOC 2 與 ISO 27001 認證，確保開發者能直接將模型應用於正式生產環境。

專用推理基礎設施對於人工智慧下一階段之重要性

投資市場對 DeepInfra 的支持，反映出人工智慧基礎設施的重要性正逐步超越模型本身。500 Global 管理合夥人 Tony Wang 指出，在智慧體驅動的開發環境中，開發者需要的是更具彈性、速度與可靠性的專用平台。本輪融資完成後，DeepInfra 的總融資額已達 1.33 億美元，資金將用於全球運算能力的擴張、深化開發者工具組，以及支援下一代自主智慧體模型；隨著每週處理代幣量接近 5 兆個，DeepInfra 目標為建構一座高效率的「代幣工廠」，為企業在人工智慧規模化應用階段提供可持續的算力基礎。

這篇文章輝達開放AI長期夥伴Deepinfra獲1.07億美元B輪融資建立「代幣工廠」最早出現於鏈新聞 ABMedia。

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。