根據 OpenAI 的說法,該公司在 5 月 8 日將 ChatGPT 的預設模型切換為 GPT-5.5 Instant。在內部測試中,該模型在高風險提示中所產生的幻覺式(hallucinated)虛構陳述比 GPT-5.3 Instant 少 52.5%,同時在使用者標記為事實錯誤的對話中,不正確陳述也減少了 37.3%。此次更新也提升了影像分析、STEM 題目處理,以及網路搜尋的決策能力。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
RLWRLD 發布用於工業機器手的 RLDX-1 AI 模型
RLWRLD,這家由 LG Electronics 支援的機器人 AI 新創公司,根據 RLWRLD 公布,推出了 RLDX-1,一種為工業應用而設計的五指機器手基礎模型。該公司已在 GitHub 與 Hugging Face 上釋出該模型的權重、程式碼與技術文件。
Model
Crypto Frontier19分鐘前
DeepMind AlphaEvolve 跨領域戰績:4×4 矩陣乘法刷新 Strassen 1969 紀錄、Gemini 訓練快 1%
Google DeepMind 5 月 7 日(美國時間)發布 AlphaEvolve 跨領域成果報告。DeepMind 官方部落格整理 AlphaEvolve 自推出以來的具體進展:找到比 Strassen 1969 演算法更好的 4×4 複數矩陣乘法方法(48 次純量乘法)、與陶哲軒(Terence Tao)等數學家合作解決多個 Erdős(艾狄胥)數學難題、為 Google 資料中心節省 0.7% 全球運算資源、把 Gemini 訓練的關鍵 kernel 速度提升 23%、整體 Gemini 訓練時間減少 1%。
架構:Gemini Flash 廣度探索 + Gemini
鏈新聞abmedia32分鐘前
OpenAI Codex 推 Chrome 擴充:可在瀏覽器測試 Web App、跨頁取 Context、平行運作
OpenAI 5 月 7 日(美國時間)公布 Codex 的 Chrome 擴充功能、讓 Codex 編碼 Agent 可直接在 macOS 與 Windows 的 Chrome 瀏覽器內運作。OpenAI Codex 官方文件說明、擴充功能讓 Codex 在不接管使用者瀏覽器的情況下、測試 web app、跨多個分頁取得 context、使用 Chrome DevTools、並與其他工作平行進行。OpenAI 同時公布 Codex 週活躍用戶超過 400 萬、較年初成長 8 倍。
瀏覽器內可做的事:測試 web app、跨頁取 context、用 DevTools
Chrome 擴充功能
鏈新聞abmedia35分鐘前
OpenAI 推 GPT-Realtime-2:把 GPT-5 推理帶入語音 Agent、context 升至 128K
OpenAI 5 月 7 日(美國時間)在開發者大會公布三款新的 Realtime 語音模型:GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper、全部透過 Realtime API 對開發者開放。OpenAI 官方公告說明、GPT-Realtime-2 是 OpenAI 第一個具備 GPT-5
鏈新聞abmedia36分鐘前
實地走訪中國 AI 實驗室:研究員揭「晶片與數據缺口」成中美差距關鍵
深度走訪中國多家 AI 實驗室的 Nathan Lambert 指出,中國的核心優勢在於文化、人才與務實心態,研究以提升模型品質為先,學生成為核心貢獻者,組織協作較少內鬥;但晶片、數據與創造力存在缺口,外部算力受美國管制、數據品質偏低促使自建訓練環境。企業開源但保留核心技術以自家微調,美國若收緊開放生態,可能影響全球領先地位。
鏈新聞abmedia46分鐘前
A16z 領投 $16M 投資輪資助瑞典 AI 新創 Pit
根據彭博社報導,瑞典 AI 新創公司 Pit 在一輪由 Andreessen Horowitz 領投的融資中籌得 1600 萬美元,Lakestar 以及多家大型 AI 和科技公司的高管也參與其中。瑞典的 Stena 和 Lundin 家族也加入了這輪融資。Pit 已經確保了與 Voi 的試點計畫,
GateNews50分鐘前