根據《紐約時報》,Google 的 AI Overview 功能在使用 Gemini 3 時的準確率為 91%,這表示它每小時會輸出數千萬則不正確答案。以 Google 每年處理超過 5 兆次搜尋量計算,這相當於每分鐘會出現數十萬則不正確回覆。
Oumi 使用 SimpleQA 基準進行分析後指出,Gemini 2 的準確率為 85%,而 Gemini 3 則提升至 91%。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
蘋果 2.5 億美元和解消費者集體訴訟,每人最高拿 95 美元賠償金
蘋果同意就AI廣告不實指控和解,達成2.5億美元金額。若法院核准,期間在美購買指定iPhone的美國消費者每台最高可領95美元賠償,涵蓋iPhone 16、16 Plus、16 Pro、16 Pro Max以及iPhone 15 Pro/Pro Max等。原告指稱宣傳將Siri塑造成AI突破,實際功能未達承諾;蘋果則稱功能分階段推出、已交付多項功能,非不實陳述。
鏈新聞abmedia7分鐘前
OpenAI 研究副總裁批評 Anthropic 被認為的立場:只有他們才能打造 AI
根據 Aidan Clark 的說法,OpenAI 的訓練研究副總裁在近期的 X 平台發文中,表達了對他從 Anthropic 同事那裡聽到的內容的批評:他們認為只有 Anthropic 才有資格被信任來打造 AI。Clark 主張,讓多個機構
GateNews7分鐘前
FIS 與 Anthropic 開發用於反洗錢的 AI 代理,並計畫在 2026 年下半年部署至 BMO 以及 Amalgamated Bank
FIS 和 Anthropic 正在開發用於自動化金融犯罪調查的 AI 代理程式,先從反洗錢作業開始。金融犯罪 AI 代理程式將從銀行系統提取資料,並將交易與已知手法進行比對評估,以協助調查人員審閱其相關內容
GateNews28分鐘前
Claude Desktop 在 5 月 6 日更新中透過白名單過濾器封鎖第三方模型
根據 Beating,Claude Desktop 在 5 月 6 日推出版本 1.6259.1,於其第三方 Gateway 模式中引入模型 ID 白名單過濾。該更新會限制介面僅顯示 ID 以「claude」或「anthropic」開頭的模型,實質上封鎖了非 Anthropic 模式的存取
GateNews40分鐘前
湯姆·李目標瞄準標普 500 指數在年底前達到 7,700,並看好 AI 與半導體股票的上行空間
根據 Tom Lee 在今天(5 月 7 日)接受 CNBC 訪談時的說法,這位分析師預測標普 500 指數可能在年底前達到 7,700 或更高。儘管美股創下新高,Lee 表示,AI 與半導體的領先股票估值仍相對合理,其遠期本益比約為 22 t
GateNews56分鐘前
Upstage 於 5 月 7 日完成對 Daum 的收購,計畫整合 Solar LLM
根據《韓國時報》,Upstage 已於 5 月 7 日完成其對 AXZ 的收購。AXZ 為南韓網路入口網站 Daum 的營運方。該交易延續了 1 月所簽署的一份備忘錄;在該備忘錄下,Kakao 以其在 AXZ 的全部持股交換 Upstage 的股權。Upstage 計劃將其 Solar 大型語言模型應用於
GateNews59分鐘前