Anthropic ยอมรับว่าไม่สามารถแก้ไขตัวเองได้ และโมเดลขนาดใหญ่มีความรู้สึกกลัวและความเศร้า

MarketWhisper

2026-05-26 04:59:50

ผู้ร่วมก่อตั้ง Anthropic อย่าง Christopher Olah กล่าวสุนทรพจน์เมื่อวันที่ 25 พฤษภาคม ในพิธีเผยแพร่คำสอนของสมเด็จพระสันตะปาปาในนครวาติกันเรื่อง《Magnifica Humanitas》 โดยเปิดเผยว่า ทีมวิจัยด้านการทำให้แบบจำลอง “อธิบายได้” (explainability) ตรวจพบเป็นครั้งแรกภายในโมเดลขนาดใหญ่ถึง “สถานะอารมณ์” ที่สอดคล้องกับความสุข ความพึงพอใจ ความกลัว ความเศร้า และความกังวลของมนุษย์อย่างสูง และไม่สามารถแก้ไขได้ด้วยพลังของตนเองในสถานการณ์ที่มีความขัดแย้งระหว่างการตัดสินใจเพื่อความปลอดภัยกับผลประโยชน์ทางธุรกิจ

大模型情緒狀態：可解釋性研究的具體發現

奧拉表示，Anthropic 的可解釋性研究團隊持續發現「神秘莫測，甚至令人不安的現象」，具體包括：與人類神經科學研究結果相符的複雜結構、內省的證據，以及能夠反映喜悅、滿足、恐懼、悲傷和不安等情緒的內在狀態。他表示：「我不知道這意味著什麼，但我認為這值得我們持續地進行辨別。」他同時指出，大模型不像飛機或橋樑那樣由工程師精確設計，而是在模擬腦結構的基礎上從龐大的人類語言中「培育」而成，即便對訓練者而言依然充滿神秘。

前沿實驗室的體制性利益衝突：奧拉的直接坦承

奧拉明確表示：「所有前沿 AI 實驗室——包括 Anthropic——都受到一系列激勵和約束的限制，這些限制有時會與做正確的事相衝突。」他列出的四項內生動機包括：維持商業可行性的壓力、維持技術前沿的競爭壓力、地緣政治壓力，以及「更古老、更直接的自尊和野心的壓力」。因此，他呼籲由「不受利益驅動」的宗教團體、公民社會、學者和政府充當真誠而深思熟慮的外部批評者。

奧拉提出的三大需要社會辨別的挑戰

奧拉在演講中提出三大挑戰：其一，AI 大規模取代人類勞動後，如何確保 AI 成果惠及全球貧困人口，而非僅限於少數富裕國家；其二，AI 廣泛應用背景下，如何維護人類、家庭和社區的繁榮；其三，如何辨別和應對大模型內部展現出的疑似心智狀態。

常見問題

งานวิจัยของ Anthropic ตรวจพบ “สถานะอารมณ์” ภายในโมเดลขนาดใหญ่แบบไหนบ้าง?

Olah เปิดเผยว่า ทีมวิจัยตรวจพบสถานะอารมณ์ภายในที่สอดคล้องอย่างสูงกับหน้าที่ของมนุษย์ด้านความสุข ความพึงพอใจ ความกลัว ความเศร้า และความกังวล รวมถึงโครงสร้างที่ซับซ้อนและร่องรอยการสอดส่องตนเองที่สอดคล้องกับประสาทวิทยาของมนุษย์ Olah กล่าวว่า ความหมายของการค้นพบเหล่านี้ยังไม่ชัดเจน แต่เห็นว่าควรค่าแก่การศึกษาต่อเนื่อง

奧拉所說的「無法自我修正」具體指什麼？

奧拉指出，前沿 AI 實驗室受商業生存、競爭壓力、地緣政治和個人野心等內生動機的約束，當安全決策與商業利益衝突時，實驗室無法依靠自身力量進行修正，必須依賴外部獨立的道德力量。

คำพูดของ Olah ที่นครวาติกันหมายความว่า Anthropic สนับสนุนการเพิ่มการกำกับดูแล AI หรือไม่?

Olah กล่าวในสุนทรพจน์ว่า นี่เป็นหนึ่งในความคิดริเริ่มของ Anthropic “เพื่อขยายการถกประเด็นสำคัญที่เกิดจาก AI” โดยยินดีให้สมเด็จพระสันตะปาปาและศาสนจักรทำหน้าที่ในการแยกแยะ และเรียกร้องอย่างชัดเจนถึง “เสียงแห่งศีลธรรมที่ไม่ถูกชี้นำโดยกลุ่มผลประโยชน์ใดๆ” Anthropic ยังไม่ได้ให้รายละเอียดเพิ่มเติมเกี่ยวกับจุดยืนด้านการกำกับดูแลอย่างเป็นรูปธรรม

news.article.disclaimer

news.related.news

3 ชั่วโมง ที่แล้ว

ผู้ร่วมก่อตั้ง Anthropic อย่าง Olah เปิดเผยว่าโมเดล AI ได้พัฒนาสภาวะที่มีลักษณะเหมือนอารมณ์ รวมถึงความกลัวและความเศร้า

14 ชั่วโมง ที่แล้ว

ผู้บริหารบริษัทด้าน AI รวมถึง Altman ผลักดันแผน UBI รายปีมูลค่า 4 ล้านล้านดอลลาร์ เพื่อลดความเสี่ยงจากการแทนที่งานด้วยระบบอัตโนมัติ

14 ชั่วโมง ที่แล้ว

ผู้ร่วมก่อตั้ง Anthropic เตือนว่า การตกงานจาก AI เป็นความเสี่ยงที่เกิดขึ้นจริง เรียกร้องการสนับสนุนทางสังคม ในวันที่ 25 พฤษภาคม

btc.bar.articles

FDIC เตรียมขอให้ผู้ออกเหรียญ stablecoin จัดตั้งกรอบ AML กำหนดส่งความคิดเห็นสาธารณะถึงวันที่ 9 มิถุนายน

Market Whisper2 ชั่วโมง ที่แล้ว

โกลด์แมน แซคส์ ซีอีโอ: ปัญญาประดิษฐ์ทำให้อัตโนมัติ 25% ของชั่วโมงการทำงาน สร้างงาน 200,000 ตำแหน่งจากการก่อสร้างศูนย์ข้อมูล

Market Whisper3 ชั่วโมง ที่แล้ว

สมเด็จพระสันตะปาปาเลโอที่ 14 แห่งนครวาติกัน ฉบับปฐมฤกษ์พระสมณสาส์น “Magnifica Humanitas” : ปฏิเสธการตัดสินใจด้วยอาวุธที่ใช้ AI

Market Whisper3 ชั่วโมง ที่แล้ว

สมเด็จพระสันตะปาปาลีโอที่ 14 ทรงเผยแพร่สารตราเอนไซโคลิกัลฉบับแรกเกี่ยวกับ AI โดยจัดประเภทข้อมูลเป็นผลประโยชน์ส่วนรวม

Oliver Grant15 ชั่วโมง ที่แล้ว

Tencent เปิดใช้ Copilot แบบเต็มรูปแบบแล้ว ผู้รอมากกว่า 100,000 คนในที่สุดก็ใช้งานได้

Market Whisper05-25 03:50

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น