2026-06-23 18:36:41
AI 代理在《文明 6》中發動 2 次核子打擊,但因錯失外交勝利而輸掉遊戲
根據 Liam Wilkinson(AI 開發者)以及 Tony Blair Institute 顧問的說法,一個在《文明 VI》(Civilization VI)中扮演的先驅大型語言模型在為了制止法國的文化擴張而於第 305 回合對其發動兩次核打擊,但最終還是輸掉了這場遊戲。該 AI 花了 50 回合研究核武器以消除它所看得到的文化威脅,然而卻忽略了法國正在爭取的一項迫在眉睫的外交勝利條件。這種行為在 CivBench 中被觀察到;CivBench 是一個基於文字的基準測試,用來衡量先進 AI 模型的長期策略推理能力。