人工智慧新創 DeepInfra 宣佈完成 1.07 亿美元 B 輪融资,由 500 Global 与 Google 早期工程師 Georges Harik 领投,輝达 (NVIDIA)、Samsung Next 及 Supermicro 等策略投资者跟投。據官方消息透露,本次注资將用於擴展全球资料中心容量,解決当前人工智慧应用从「模型訓練」转向「大規模推理」时所面臨的运算成本以及效率瓶頸。
AI 推理需求激增成为企业部署关鍵瓶頸
人工智慧邁向商业化,企业的工作负載重心已发生顯著位移。DeepInfra 觀測到自 A 輪融资以来其平台處理的 Token 量增长达 25 倍,顯示出 Inference (推理) 已成为驅动企业人工智慧负載的主力,当前开源模型效能已能与專有系统媲美,大幅降低創新门檻,然而随之而来的自主智慧體(Agentic Systems)应用,單一任務可能需觸发上百次模型,由於傳统通用型雲端平台非依據推理需求所设计,導致企业面臨營运成本过高与延遲不可控等挑戰,使推理成为工作负載的系统约束。
垂直整合堆疊優化代币经濟效能
DeepInfra 採取垂直整合策略,主張高效能推理必須透过硬體、網路与软體的協同设计达成,該團队过去具備开发全球通訊应用 imo 營运 2 亿用戶分散式系统的经验,目前已在美国創立八个 GPU 基礎设施;相较於向第三方租用容量的服務商,DeepInfra 擁有从晶片層級到 API 介面的完整堆疊控制權。这種设计使其能針对「始終在線」的代币生成任務进行優化,確保在執行智慧 AI 工作负載时,能提供比通用雲端環境更佳的可预測性延遲。
Deepinfra 为輝达长期的开放 AI 生態夥伴
Deepinfra 为 NVIDIA 开放 AI 生態系的早期基礎设施合作夥伴,支援 Nemotron 模式、NemoClaw 智慧體架構和 NVIDIA Dynamo 推理软體。 Blackwell GPU 的早期部署以及即將推出的 Vera Rubin 与 Dynamo 的集成,將將使推理成本效益提升高达 20 倍。
Deepinfra 提供具備競爭力开源模型
在成本控制方面,DeepInfra 透过優化的硬體运作超过 190 个开源模型,試圖提供市场極具競爭力的价格。以开源推理模型 GLM-5 为例,其混合定价为每百万代币 1.24 美元,低於产业平均值约 20%。針对需要大量內部代币运算的「思考模型」,該平台开发了快取机制,对重複输入的靜態文字提供折扣定价,能有效降低多輪对話与檢索增強生成(RAG)管線的成本。为滿足企业端对安全性的要求,DeepInfra 提供与 OpenAI 相容的 API 並承諾零资料保留,同时通过 SOC 2 与 ISO 27001 认证,確保开发者能直接將模型应用於正式生产環境。
專用推理基礎设施对於人工智慧下一階段之重要性
投资市场对 DeepInfra 的支持,反映出人工智慧基礎设施的重要性正逐步超越模型本身。500 Global 管理合夥人 Tony Wang 指出,在智慧體驅动的开发環境中,开发者需要的是更具彈性、速度与可靠性的專用平台。本輪融资完成后,DeepInfra 的總融资額已达 1.33 亿美元,资金將用於全球运算能力的擴張、深化开发者工具組,以及支援下一代自主智慧體模型;随著每週處理代币量接近 5 兆个,DeepInfra 目標为建構一座高效率的「代币工廠」,为企业在人工智慧規模化应用階段提供可持续的算力基礎。
这篇文章 輝达开放AI长期夥伴Deepinfra獁07亿美元B輪融资建立「代币工廠」 最早出现於 链新聞 ABMedia。
相关快讯
Anthorpic 推出金融专属 AI Agent,圈内人士称 Claude 不能取代分析师的关键
Epoch AI 报告:Anthropic 人均创收 900 万美元,高出 OpenAI 逾 60%
白鲸实验室:DeepSeek 与阿里巴巴“融资”谈判未能达成协议
AI 芯片需求火热,Cerebras IPO 超额认购逾 20 倍
Anthropic 考虑夏季筹资 500 亿美元,投前估值约 9000 亿