OpenAI 表示其新款面向醫生的 ChatGPT 在臨床任務中優於人類

簡要說明

  • OpenAI 推出專為臨床醫生設計的 ChatGPT 版本,旨在支援臨床任務,如文件記錄和醫學研究。
  • 該平台對經過驗證的美國醫生、護士執業者、醫師助理和藥劑師免費開放。
  • OpenAI 表示,根據其自身的基準測試,該聊天機器人在某些臨床任務中超越了人類醫生。

OpenAI 在週三推出了一個免費的專為醫生、護士執業者、醫師助理和藥劑師設計的 ChatGPT 專用版本,進一步深化公司在醫療行業的布局,該行業正面臨人手短缺、行政負擔過重和倦怠問題。 該產品名為 ChatGPT for Clinicians,旨在處理文件記錄、醫學研究和護理諮詢——這些都是耗時的任務,佔用了臨床醫生與患者相處的時間。目前僅限於美國的驗證執業者使用,並計劃擴展到國際市場。 此公告正值醫學領域 AI 應用快速增長之際。根據 OpenAI 引用的美國醫學會於 2026 年進行的調查,72% 的醫生現在在臨床實踐中使用 AI,較一年前的 48% 有顯著增加。該公司表示,醫生對其平台的使用在過去一年中已翻倍,數百萬人每週依賴 ChatGPT。

該工具的功能包括一個臨床搜索功能,能夠調用數百萬篇同行評審資料,一個用於醫學文獻回顧的深度研究模式,還有可重用的工作流程模板,用於轉診信和事前授權請求等任務,以及在平台上研究臨床問題時獲取持續醫學教育學分的能力。  對話內容不會用於訓練 OpenAI 的模型,並且對符合條件的帳戶提供 HIPAA 合規支援,通過商業合作協議來保障資料安全。 在推出的同時,OpenAI 發布了 HealthBench Professional,一個新的基準測試,用於評估 AI 在三個類別的現實臨床任務中的表現:護理諮詢、文件記錄和醫學研究。

公司報告稱,運行在 ChatGPT for Clinicians 工作空間中的 GPT-5.4 在該基準測試中的得分為 59.0,超過人類醫生的 43.7,即使人類醫生擁有無限時間和網路連接,且高於 Anthropic、Google 和 xAI 的競爭模型。 然而,這些結果有一個重要的警示:OpenAI 同時開發了該產品和用於評估的基準測試。 為了開發這個工具,該公司表示與數百名醫師顧問合作,並審查了超過 70 萬個模型回應。在預測試中,醫生評價近 7,000 次對話中的 99.6% 回應為安全且準確。 OpenAI 小心地將該工具定位為一個支援系統,而非臨床判斷的替代品——這一點,監管機構和懷疑者在產品更廣泛推廣時可能會密切關注。 醫療保健是 AI 工具快速擴展的市場。除了 OpenAI 的數據顯示,醫生對 ChatGPT 的使用在過去一年中已翻倍外,麥肯錫的數據顯示,50% 的醫療領導者表示其組織已實施生成式 AI,較 2024 年第四季的 47% 和 2023 年第四季的 25% 有明顯提升。波士頓顧問集團的研究則顯示,60% 的消費者已經在個人健康方面使用 AI。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言