人工智慧新創 DeepInfra 宣佈完成 1.07 億美元 B 輪融資,由 500 Global 與 Google 早期工程師 Georges Harik 領投,輝達 (NVIDIA)、Samsung Next 及 Supermicro 等策略投資者跟投。據官方消息透露,本次注資將用於擴展全球資料中心容量,解決當前人工智慧應用從「模型訓練」轉向「大規模推理」時所面臨的運算成本以及效率瓶頸。
AI 推理需求激增成為企業部署關鍵瓶頸
人工智慧邁向商業化,企業的工作負載重心已發生顯著位移。DeepInfra 觀測到自 A 輪融資以來其平台處理的 Token 量增長達 25 倍,顯示出 Inference (推理) 已成為驅動企業人工智慧負載的主力,當前開源模型效能已能與專有系統媲美,大幅降低創新門檻,然而隨之而來的自主智慧體(Agentic Systems)應用,單一任務可能需觸發上百次模型,由於傳統通用型雲端平台非依據推理需求所設計,導致企業面臨營運成本過高與延遲不可控等挑戰,使推理成為工作負載的系統約束。
垂直整合堆疊優化代幣經濟效能
DeepInfra 採取垂直整合策略,主張高效能推理必須透過硬體、網路與軟體的協同設計達成,該團隊過去具備開發全球通訊應用 imo 營運 2 億用戶分散式系統的經驗,目前已在美國創立八個 GPU 基礎設施;相較於向第三方租用容量的服務商,DeepInfra 擁有從晶片層級到 API 介面的完整堆疊控制權。這種設計使其能針對「始終在線」的代幣生成任務進行優化,確保在執行智慧 AI 工作負載時,能提供比通用雲端環境更佳的可預測性延遲。
Deepinfra 為輝達長期的開放 AI 生態夥伴
Deepinfra 為 NVIDIA 開放 AI 生態系的早期基礎設施合作夥伴,支援 Nemotron 模式、NemoClaw 智慧體架構和 NVIDIA Dynamo 推理軟體。 Blackwell GPU 的早期部署以及即將推出的 Vera Rubin 與 Dynamo 的集成,將將使推理成本效益提升高達 20 倍。
Deepinfra 提供具備競爭力開源模型
在成本控制方面,DeepInfra 透過優化的硬體運作超過 190 個開源模型,試圖提供市場極具競爭力的價格。以開源推理模型 GLM-5 為例,其混合定價為每百萬代幣 1.24 美元,低於產業平均值約 20 %。針對需要大量內部代幣運算的「思考模型」,該平台開發了快取機制,對重複輸入的靜態文字提供折扣定價,能有效降低多輪對話與檢索增強生成(RAG)管線的成本。為滿足企業端對安全性的要求,DeepInfra 提供與 OpenAI 相容的 API 並承諾零資料保留,同時通過 SOC 2 與 ISO 27001 認證,確保開發者能直接將模型應用於正式生產環境。
專用推理基礎設施對於人工智慧下一階段之重要性
投資市場對 DeepInfra 的支持,反映出人工智慧基礎設施的重要性正逐步超越模型本身。500 Global 管理合夥人 Tony Wang 指出,在智慧體驅動的開發環境中,開發者需要的是更具彈性、速度與可靠性的專用平台。本輪融資完成後,DeepInfra 的總融資額已達 1.33 億美元,資金將用於全球運算能力的擴張、深化開發者工具組,以及支援下一代自主智慧體模型;隨著每週處理代幣量接近 5 兆個,DeepInfra 目標為建構一座高效率的「代幣工廠」,為企業在人工智慧規模化應用階段提供可持續的算力基礎。
這篇文章 輝達開放AI長期夥伴Deepinfra獲1.07億美元B輪融資建立「代幣工廠」 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Nvidia 於 2026 年初承諾投資超過 400 億美元於 AI,包括 300 億美元投資 OpenAI
根據 TechCrunch,Nvidia 在 2026 年前幾個月承諾投入超過 400 億美元於 AI 公司股權投資,其中對 OpenAI 的 300 億美元投資是單一最大承諾。這家晶片製造商也承諾最高 32 億美元投資玻璃製造商 Corning,並投資至多 21 億美元給資料中心營運商 IREN,其中包括一份為期五年的認股權證,以及一份價值 34 億美元、用於採用 Nvidia Blackwell 系統的託管 GPU 雲端服務的獨立合約。根據 FactSet 數據,Nvidia 今年宣布了對上市公司進行七項數十億美元級別的投資,同時也參與了約兩打(約 24 次)私營新創公司的募資輪次。
GateNews1小時前
歐洲央行(ECB)執委會成員埃斯克里瓦(Escrivá)在 5 月 9 日警示 AI 對金融基礎設施的風險
ECB 管理委員會成員埃斯克里瓦(Escrivá)在 5 月 9 日表示,鑑於人工智慧發展,中央銀行必須重新評估金融基礎設施的韌性以及資安防護的健全程度。根據他在一場活動中的發言,近期 AI 的進展迫使人們重新評估金融系統能否承受新興風險。
GateNews2小時前
SpaceX 將 xAI 改名為 SpaceXAI,於 17500億億美元 IPO 前提交軌道運算商標
根據向美國專利與商標局提交的商標申請,Elon Musk 的人工智慧公司 xAI 正在以新品牌 SpaceXAI 的名義併入 SpaceX。此次改牌涵蓋基於衛星的資料中心、軌道運算、雲端運算,以及透過太空平台進行 AI 工作負載管理。Musk 確認 xAI 將作為獨立公司解散,AI 產品將以 SpaceXAI 運作,並配有其自家標誌。 此舉同時也發生在 SpaceX 與 Anthropic 之間達成重大運算合作的時點,屆時該 AI 公司將向 SpaceX 位於田納西州孟菲斯的 Colossus 1 超級電腦租用運算產能,取得超過 300 兆瓦的電力以及超過 220,000 張 Nvidia GPU。分析師估計,Anthropic 的合作案可能為 SpaceX 每年帶來 30 億美元至 60 億美元的營收。改牌是在 SpaceX 準備一宗據報估值高達 1.75 兆美元的 IPO 之際到來。
GateNews4小時前
輝達 Space Computing 生態鏈出爐,Space-1 Vera Rubin 把資料中心級 AI 算力送上太空
NVIDIA 推出 Space Computing,欲把 AI 推理與資料融合能力直接放到太空端,Space-1 Vera Rubin 模組在軌道上提供資料中心級算力,Jetson Orin 與 IGX Thor 支援衛星端邊緣運算,地面端以 RTX Pro 6000 Blackwell 提升處理效能。生態伙伴含 Axiom Space、Planet Labs 等,打造從衛星到地面站的完整 AI 運算架構。
鏈新聞abmedia10小時前
Chrome 於 5 月 9 日自動下載多吉字節 Gemini Nano AI 模型,引發加密社群的資安疑慮
根據 BlockBeats 指出,5 月 9 日 Chrome 在未獲使用者明確同意的情況下,會自動將一個多個數 GB 的 AI 模型檔案(Gemini Nano)下載到使用者裝置,用於本地端詐欺偵測、網頁摘要以及 AI 功能。 儘管 Google 表示,本地端執行 AI 能提升隱私與安全性,但加密貨幣使用者對缺乏透明度以及未獲明確授權提出疑慮。隨著瀏覽器日益成為加密貨幣錢包、鏈上交易與 DApps 的核心入口,這一舉措也加劇了產業對攻擊面擴大的擔憂,其中包括惡意擴充功能、偽造的交易頁面以及錢包遭劫持的風險。
GateNews10小時前
美國法官裁定 DOGE 補助金削減在使用 ChatGPT 以及 DEI 關鍵字後屬非法,並阻止週四的執行
根據 ABC News,週四一名美國聯邦法官裁定,由 Elon Musk 支持的 DOGE 所進行的補助削減屬於非法。紐約的美國地方法官 Colleen McMahon 表示,工作人員使用 ChatGPT 以及包含「DEI」、「Equity」、「Inclusion」和「LGBTQ」等關鍵字的搜尋,以協助終止跨越人文學科國家基金會(National Endowment for the Humanities)的資助計畫。法官阻止特朗普政府強制執行這些有爭議的取消措施,並指出審查流程未能符合任何正常的聯邦補助審查制度。McMahon 寫道,將受保護的身分與與多元相關的用語作為移除資金的理由,可能已違反法律。
GateNews12小時前