根據 Beating,OpenAI 在其 Realtime API 中發布了三款語音模型:GPT-Realtime-2 用於具有推理能力的語音對話、GPT-Realtime-Translate 用於即時翻譯,以及 GPT-Realtime-Whisper 用於串流轉錄。GPT-Realtime-2 是 OpenAI 首款具備 GPT-5 等級推理能力的語音模型,將上下文視窗從 32K 擴展至 128K tokens,並支援最多 1-2 小時的高密度對話。
相較於 GPT-Realtime-1.5,GPT-Realtime-2 在 Big Bench Audio 基準上提升了 15.2%,在 Audio MultiChallenge 上提升了 13.8%。GPT-Realtime-Translate 支援 70+ 種輸入語言,翻譯為 13 種輸出語言。定價:GPT-Realtime-2 的輸入為 3.2萬美元/百萬輸入 tokens、輸出為 64 萬美元/百萬輸出 tokens;Translate 為 0.034 美元/分鐘;Whisper 為 0.017 美元/分鐘。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
CoreWeave 以 2.08B 美元的 Q1 營收超越預期,股價上漲 3%
根據路透社,CoreWeave 於 5 月 7 日公布第一季營收 20.8 億美元,優於分析師平均預估的 19.7 億美元。由於用於訓練與運行 AI 模型的高效能運算需求強勁,推動了該雲端服務供應商的成長。其股價在盤後延長交易中上漲 3%
GateNews18分鐘前
OpenAI 將 ChatGPT 預設模型切換為 GPT-5.5 Instant,將幻覺降低 52.5%
根據 OpenAI 的說法,該公司在 5 月 8 日將 ChatGPT 的預設模型切換為 GPT-5.5 Instant。在內部測試中,該模型在高風險提示下,所產生的錯誤幻覺式陳述比 GPT-5.3 Instant 少 52.5%,且在對話中被使用者標記為需查核事實的情況下,不正確陳述減少 37.3% er
GateNews28分鐘前
Nvidia 執行長黃仁勳:下一代 AI 基礎設施需要大量光學連接,銅材不足以支撐,5 月 8 日
根據 BlockBeats 報導,5 月 8 日,Nvidia 執行長賈森・黃(Jensen Huang)表示,下一代 AI 基礎設施將需要大量的光學連接,因為銅材無法滿足快速成長的運算需求。黃讚揚 Nvidia 與 Corning 的新合作,稱其是一個重要的機會
GateNews32分鐘前
Cloudflare 裁撤 1,100+ 名員工(員工規模的 20%)以轉向由 AI 驅動的營運
根據路透社,Cloudflare 在 5 月 8 日裁撤了超過 1,100 名員工,約佔其員工總數的 20%,以重組圍繞 AI 工具的營運。首席執行官 Matthew Prince 表示,公司正在重新設計每個團隊與職能,以適應「代理式 AI」時代,並指出內部已在使用 AI
GateNews46分鐘前
Google 以 99.99 美元推出 Fitbit Air,無螢幕追蹤器將於 5 月 26 日成為 Gemini Health Coach Hub
根據 Beating,Google 推出 Fitbit Air,這是一款無螢幕的健康追蹤器,售價為 99.99 美元,預計將於 5 月 26 日出貨。該裝置重量僅 5.2 克,並具備 7 天續航電池,且支援 5 分鐘快充能力。感測器可追蹤 24 小時心率、心房顫動偵測、血氧, h
GateNews48分鐘前
Google Gemini 3.1 Flash-Lite 正式推出:輸入價格比 Claude 4.5 Haiku 便宜 75%,GPQA 分數 86.9%
根據 Beating,Google Gemini 3.1 Flash-Lite 已由預覽轉為一般可用(GA),於 5 月 8 日上線,成為 Gemini 3 系列中最便宜且最快的模型。輸入定價為每 100 萬 tokens 收費 0.25 美元,輸出為每 100 萬 tokens 收費 1.50 美元——輸入成本比
GateNews1小時前