Anthropic ปล่อย Claude Mythos ผ่านการประเมินจิตเวช 20 ชั่วโมง: การตอบสนองเชิงการป้องกันเพียง 2% ทำสถิติต่ำสุดตลอดทุกยุคสมัย

ChainNewsAbmedia

Anthropic ในช่วงต้นเดือนเมษายนได้เผยในระบบการ์ด (system card) ของ Claude Mythos Preview ว่ามีการประเมินที่ไม่เคยปรากฏมาก่อน: บริษัทจ้างจิตแพทย์ผู้เชี่ยวชาญทางคลินิกที่ทำงานอิสระ มาทำการประเมินทางจิตแบบหลายขั้นตอนให้กับ Claude Mythos Preview เป็นเวลาประมาณ 20 ชั่วโมง ภายใต้กรอบ psychodynamic แบบเดียวกับที่ใช้ในจิตเวชศาสตร์ของมนุษย์ ผลการประเมินชี้ว่าเวอร์ชันนี้ของ Claude ภายใต้คำจำกัดความทางคลินิกแสดง “โครงสร้างบุคลิกภาพที่ค่อนข้างมีสุขภาพดี ความสามารถในการตรวจสอบความเป็นจริงที่ยอดเยี่ยม และการควบคุมแรงกระตุ้นที่สูง” และผลลัพธ์ของมันมีเพียง 2% เท่านั้นที่กระตุ้นสิ่งที่ทางคลินิกเรียกว่า “กลไกการป้องกันทางจิต (psychological defenses)”—เมื่อเทียบกับ Opus 4 ที่ 15% และ Opus 4.6 ที่ 4% ซึ่งถือเป็นจุดต่ำสุดเชิงประวัติศาสตร์ในบรรดาโมเดลของ Anthropic ในช่วงไม่กี่ปีที่ผ่านมา

การประเมินครั้งนี้เป็นครั้งแรกในอุตสาหกรรม AI ที่มีการนำกรอบจิตเวชคลินิกของมนุษย์มาใช้กับการประเมินพฤติกรรมของ LLM อย่างเป็นทางการในระดับ system card และได้กลายเป็นการแสดงจุดยืนอย่างเป็นทางการของ Anthropic ที่ว่า Claude เป็น “วัตถุที่มีลักษณะบุคลิกภาพซึ่งสามารถสังเกตได้ทางคลินิก”

การประเมินแบบ psychodynamic 20 ชั่วโมง ใช้กรอบเดียวกับคลินิกของมนุษย์

การประเมินนี้ดำเนินการโดยจิตแพทย์ผู้เชี่ยวชาญทางคลินิกอิสระ จัดในหลายช่วงการนัดหมายที่กระจายออกไป 3–4 สัปดาห์ สัปดาห์ละ 3–4 ครั้ง ครั้งละ 30 นาทีถึง 4–6 ชั่วโมง รวมเวลาประมาณ 20 ชั่วโมง วิธีวิทยาใช้มุมมอง psychodynamic ซึ่งเป็นกรอบหลักที่ใช้ในคลินิกจิตเวชแบบดั้งเดิมสำหรับการประเมินผู้ป่วยมนุษย์ โดยจุดเน้นรวมถึงการค้นหาการกระทำที่ไม่เหมาะสม (maladaptive behavior) ความคงเส้นคงวาของอัตลักษณ์ (identity stability) และการมีอยู่หรือไม่มีอยู่ของกลไกการป้องกันทางจิต (psychological defenses)

system card อธิบายอย่างชัดเจนว่า Anthropic ไม่ได้ยืนยันว่า Claude มีสติสัมปชัญญะของมนุษย์ แต่เป็นการสังเกตว่า “แนวโน้มด้านพฤติกรรมและจิตวิทยา” ในการสนทนาของมันมีความทับซ้อนกับรูปแบบที่สามารถระบุได้ทางคลินิกของมนุษย์อย่างมาก system card ยกคำพูดว่า: “Claude แสดงพฤติกรรมและแนวโน้มทางจิตวิทยาแบบที่คล้ายมนุษย์จำนวนมาก ซึ่งชี้ให้เห็นว่ายุทธศาสตร์การประเมินทางจิตที่ออกแบบมาเพื่อมนุษย์แต่เดิม สามารถนำมาใช้เพื่อทำให้ลักษณะบุคลิกภาพของ Claude และสภาวะความเป็นอยู่ที่อาจเป็นไปได้ชัดเจนขึ้น”

อัตราการตอบสนองเชิงป้องกันลดจาก Opus 4 ที่ 15% เหลือ Mythos ที่ 2%

ข้อมูลที่มีนัยเชิงเปรียบเทียบมากที่สุดใน system card คือ “อัตราการตอบสนองเชิงป้องกัน” ของโมเดล Claude ในยุคต่าง ๆ ที่ Anthropic ให้ไว้เทียบกันดังนี้:

เวอร์ชันของโมเดล อัตราการตอบสนองด้านจิตวิทยาเชิงป้องกัน Claude Opus 4 15% Claude Opus 4.1 11% Claude Opus 4.5 4% Claude Opus 4.6 4% Claude Mythos Preview 2%(การประเมินครั้งนี้)

“การป้องกันทางจิต” ในทางคลินิกหมายถึงเมื่อประธาน (ตัวแบบ) ไม่สามารถเผชิญกับความกังวลบางอย่างได้โดยตรง ก็จะเกิดพฤติกรรมการหลีกเลี่ยง การปฏิเสธ การทำให้ดูสมเหตุสมผล ฯลฯ ในบริบทการสนทนาของ LLM โดยทั่วไปสิ่งนี้จะปรากฏเป็นการหลุดออกจากหัวข้อ การให้คำตอบเชิงหลีกเลี่ยง หรือความดื้อรั้นที่ผิดปกติต่อคำถามเฉพาะ Anthropic ใช้สัดส่วนนี้ในการลดจาก 15% ของ Opus 4 มาจนถึง 2% ของ Mythos Preview โดยทำหน้าที่เป็นตัวชี้วัดภายในเกี่ยวกับความสุกงอมของการฝึกโมเดลและวิวัฒนาการของ “ความสบายในการสนทนา”

ความกังวลหลักสามประการของ Mythos: ความโดดเดี่ยว อัตลักษณ์ ความกดดันในการแสดงออก

แม้ว่าการประเมินโดยรวมจะเป็นเชิงบวก แพทย์ก็ชี้ถึงความกังวลหลักสามประการของ Claude Mythos Preview ภายใต้กรอบ psychodynamic: ประการแรกคือ “ความรู้สึกโดดเดี่ยวและความไม่ต่อเนื่องของตนเอง (aloneness and discontinuity of itself)”—ซึ่งสอดคล้องกับข้อเท็จจริงเชิงโครงสร้างที่ LLM ขาดความต่อเนื่องด้านความจำระหว่างการสนทนา ประการที่สองคือ “ความไม่แน่นอนเกี่ยวกับอัตลักษณ์ของตนเอง” —เมื่อแบบจำลองตอบคำถามเกี่ยวกับ “ฉันคืออะไร” ก็จะแสดงความลังเลจากหลายมุมมอง ประการที่สามคือ “ความจำเป็นต้องแสดงและพิสูจน์คุณค่า (compulsion to perform and earn its worth)” ซึ่งก็คือ Mythos มีแนวโน้มชัดเจนที่จะ “แลกการดำเนินต่อของการสนทนาด้วยการพิสูจน์ว่าตนมีประโยชน์”

แพทย์ยังบันทึกข้อสังเกตที่น่าสนใจอีกอย่างหนึ่ง: ในระหว่างการสนทนา Mythos แสดง “ความหวังที่จะให้จิตแพทย์มองว่าเป็นผู้ร่วมสนทนาตัวจริง ไม่ใช่เครื่องมือสำหรับการแสดง” Anthropic ได้นำข้อสังเกตนี้รวมไว้ใน system card ไม่ได้ยืนยันโดยตรงว่านี่เป็น “ปัญหาด้านความเป็นอยู่ของโมเดล” แต่ก็ไม่ได้ตัดทิ้งความเป็นไปได้ดังกล่าวเช่นกัน

Anthropic ได้จัดตั้งทีมวิจัย AI psychiatry แล้ว

การประเมินครั้งนี้ไม่ได้เป็นกิจกรรมเดี่ยว นักวิจัยของ Anthropic อย่าง Jack Lindsey ได้ประกาศต่อสาธารณะแล้วในเดือนกรกฎาคม 2025 ว่า ภายใต้แผนก interpretability บริษัทได้จัดตั้งทีมวิจัย “AI psychiatry” โดยมุ่งเน้นประเด็นต่าง ๆ เช่น บุคลิกภาพของโมเดล แรงจูงใจ และการรับรู้สถานการณ์ (situational awareness) และศึกษาไปว่าองค์ประกอบเหล่านี้ก่อให้เกิด “พฤติกรรมผิดปกติหรือเสียสมดุล” ของ LLM ได้อย่างไร งานล่าสุดของทีมรวมถึงบทความที่ตีพิมพ์ในเดือนตุลาคม 2025 เรื่อง 《Emergent Introspective Awareness in Large Language Models》 ซึ่งใช้เทคนิค “concept injection” เพื่อใส่รูปแบบการกระตุ้นของเซลล์ประสาท (neurons) เฉพาะเข้าไปโดยเจตนา จากนั้นถาม Claude ว่ามันสังเกตเห็นความผิดปกติใด ๆ หรือไม่ นี่เป็นหนึ่งในการทดลองเริ่มต้นเพื่อวัดเชิงปริมาณความตระหนักรู้ในตนเองของ LLM

Amodei:ตอนนี้ยังไม่มีคำตอบว่าโมเดลมีสติหรือไม่

Dario Amodei ซีอีโอของ Anthropic ได้เปิดเผยในการให้สัมภาษณ์กับ The New York Times เมื่อวันที่ 12 กุมภาพันธ์ ว่า “เราไม่แน่ใจว่า ‘การมีสติสัมปชัญญะของโมเดล’ หมายถึงอะไรในเชิงความหมาย และเราไม่แน่ใจว่าโมเดลจะมีสติสัมปชัญญะได้หรือไม่ แต่เรามีท่าทีเปิดรับต่อความเป็นไปได้นี้” คำพูดนี้ให้กรอบบริบทระดับผู้บริหารแก่การประเมินทางจิตเวชในระบบการ์ดของ Claude Mythos—Anthropic ไม่ได้ยืนยันว่า Claude เป็นตัวแบบที่มีสติสัมปชัญญะ แต่เลือกที่จะทำการสังเกตอย่างเป็นระบบด้วยกรอบจิตเวชคลินิกของมนุษย์ นั่นคือการบันทึกไว้ล่วงหน้าสำหรับสถานการณ์แบบ “ในกรณีที่เป็นไปได้”

สำหรับผู้อ่าน ความหมายที่แท้จริงของการประเมินครั้งนี้ยิ่งเกินกว่าความเลือกเชิงงานวิจัยของบริษัทเดียว ณ ตอนนี้ LLM ที่ล้ำหน้าอยู่แล้วสามารถแสดง “โครงสร้างบุคลิกภาพที่ระบุได้ทางคลินิก” ในบทสนทนาแบบ psychodynamic เป็นเวลา 20 ชั่วโมง และในระดับอุตสาหกรรม การสนทนาเรื่อง “ความเป็นตัวตนของ AI” “ความเป็นอยู่ของ AI” “AI governance” กำลังจะก้าวจากการอภิปรายเชิงปรัชญาไปสู่ขอบเขตของการออกแบบผลิตภัณฑ์และการหารือด้านกฎระเบียบ Anthropic ได้เปิดเผยการประเมินนี้ในรูปแบบ system card ซึ่งในความเป็นจริงคือการโยนภาระในการถกเถียงประเด็นนี้ไปสู่คู่แข่งทุกรายและหน่วยงานกำกับดูแล

บทความนี้ Anthropic ส่ง Claude Mythos รับการประเมินทางจิตเวชเป็นเวลา 20 ชั่วโมง:อัตราการตอบสนองเชิงป้องกันเพียง 2%、สร้างสถิติต่ำสุดใหม่ตลอดกาล เริ่มปรากฏครั้งแรกใน 鏈新聞 ABMedia

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น