AI聊天机器人给出的医疗建议有50%是错误的,BMJ Open研究发现

Gate News 消息,4月15日——一项最近发表在《BMJ Open》的研究发现,五个主要的 AI 聊天机器人在约 50% 的案例中提供了有问题的医疗建议,其中接近 20% 的回答被归类为高度有问题。来自美国、加拿大和英国的研究人员使用 10 个问题、覆盖五个健康主题来测试 ChatGPT、Gemini、Meta AI、Grok 和 DeepSeek。

这些聊天机器人在封闭式问题以及诸如疫苗和癌症等主题上表现更好,但在开放式问题以及诸如干细胞和营养等主题上则感到困难。被测试的聊天机器人均未生成完整且准确的参考文献列表。

该研究的作者警告称,面向公众的聊天机器人可能会放大错误信息,因为这些工具并未获许可提供医疗建议,并且可能在缺乏依据的情况下以过度确定的语气呈现有缺陷的答案。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

AI 建筑设计新创 Illoca 融资 1,300 万美元,台裔创办人如何把创意还给建筑师?

由两位台裔创办人创办的美国 AI 建筑设计新创 Illoca 于 2026 年 5 月 6 日宣布完成 1,300 万美元种子轮融资,由 Bessemer Venture Partners 领投,AIX Ventures、Root Ventures 及 Alt Ventures 参投。Illoca 以“AI 原生设计引擎”为核心定位,致力于将创作主导权还给建筑师,解决困扰业界数十年的生产力黑洞。 (Claude

鏈新聞abmedia15 分钟前

Google 和 Naver 将推送广告接入 AI 搜索工具;Naver 第一季度收入增长 16.3% 至 22.2 亿美元

据《韩国时报》称,随着生成式 AI 重塑搜索行为并推高算力成本,Google 和 Naver 正在将广告引入 AI 搜索工具。Google 正在传递其对在 Gemini 中投放广告的开放态度,而 Naver 计划在第二季度于其 AI Briefing 产品中测试以答复形式呈现的广告。 Naver

GateNews28 分钟前

三星暂停在中国销售家用电器以转向人工智能

据《南华早报》报道,三星电子在 5 月 6 日宣布,将停止在中国大陆销售家用电器。此次退出涵盖电视、冰箱、空调、洗衣机、烘干机、真空吸尘器和空气净化器,原因是公司将战略重心转向了

Crypto Frontier28 分钟前

里德·霍夫曼:AI 代理将需要加密信任系统

雷德·霍夫曼,Greylock 合伙人以及 LinkedIn 联合创始人表示,自主代理将需要基于加密货币的信任系统,才能在开放互联网中进行交易,这意味着这一发展可能会为 NFT 的回归铺平道路。 霍夫曼的表述将自主代理的出现与

Crypto Frontier29 分钟前

软银上涨 16.5%,因 AI 芯片反弹在 5 月 7 日提振日本股市

据 CNBC 报道,软银集团在 5 月 7 日上涨 16.5%,原因是日本市场在为期黄金周的休市后重新开盘。涨幅源于投资者追逐席卷全球的 AI 以及芯片类股票反弹,从而推动日经 225 指数创下历史新高。安怀测试(Advantest)上涨 7.8%,东京电子(Tokyo Electron)上涨 9.2%,而瑞萨(Renesas)

GateNews48 分钟前

Anthropic 执行长亲口承认 Q1 增长 80 倍:解释为何要拿下 SpaceX 全部算力

Anthropic 执行长 Dario Amodei 在 Code with Claude 大会表示,Q1 的年化营收与使用量本预估 10 倍,实际却成长 80 倍;他直呼“疯狂、太难应付”,但会加速提供更多算力、放宽用户限额。当日亦宣布取得 SpaceX Colossus 1 全部算力(约 300+ MW、22 万颗英伟达 GPU),预计一个月内上线,作为成长背后的商业背景。尚未公布具体金额,后续财报再证实倍数。

鏈新聞abmedia55 分钟前
评论
0/400
暂无评论