Anthropic แทนที่ Claude Fable 5 จากมาตรการปกป้องที่มองไม่เห็น 5 ประการด้วยการสำรองที่มองเห็นได้

Anthropic ยอมรับในสัปดาห์นี้ว่าเกราะป้องกันที่มองไม่เห็นในโมเดล Claude Fable 5 ของตนคือ “ความสมดุลที่แลกผิด” และประกาศว่าจะเปลี่ยนมาใช้ตัวช่วยที่มองเห็นได้แทนใน Claude Opus 4.8 เริ่มตั้งแต่สัปดาห์นี้ บริษัทเผชิญกระแสต่อต้านหลังจากเปิดตัว Claude Fable 5 ซึ่งเป็นตัวแรกของคลาส Mythos ใหม่ โดยมีเกราะป้องกันซ่อนอยู่ในเอกสารระบบความยาว 319 หน้า ที่แอบลดทอนคำตอบสำหรับผู้ใช้ที่สงสัยว่ากำลังพัฒนาโมเดล AI แข่งขันเอง ความขัดแย้งปะทุขึ้นหลังจากบริษัทวิจัยด้าน AI อย่าง SemiAnalysis รายงานต่อสาธารณะเมื่อวันที่ 9 มิถุนายน 2026 ว่างานวิจัยการอนุมานด้วย GPU ของพวกเขาถูกตั้งค่าสถานะต้องเฝ้าระวัง และ Anthropic โพสต์ขอโทษบน X ในวันที่ 11 มิถุนายน 2026

เกราะป้องกันที่มองไม่เห็นทำงานแตกต่างจากการปกป้องที่มองเห็นได้ซึ่งโมเดลมีอยู่เดิมสำหรับงานวิจัยด้านความปลอดภัยทางไซเบอร์และชีววิทยา โดยการปกป้องแบบเดิมจะแจ้งผู้ใช้เมื่อคำขอถูกส่งต่อไปยังโมเดล Opus 4.8 รุ่นเก่า

Anthropic ประกาศระบบทางเลือกที่มองเห็นได้สำหรับคำขอที่ถูกตั้งค่าสถานะ

ตั้งแต่สัปดาห์นี้ คำขอที่ถูกตั้งค่าสถานะจะถูกส่งไปยัง Claude Opus 4.8 อย่างชัดเจนแทนที่จะส่งผลลัพธ์ Fable ที่ถูกลดทอนแบบเงียบ ๆ ผู้ใช้งานฝั่ง API จะได้รับเหตุผลที่ระบุเมื่อคำขอถูกปฏิเสธ Anthropic ระบุว่าจะทยอยเปิดตัวการแจ้งเตือนทางฝั่งเซิร์ฟเวอร์ในไม่กี่วันข้างหน้า บริษัทโพสต์บน X ว่า: “เกราะป้องกันที่มองไม่เห็นสามารถถูกกำหนดเป้าหมายให้แคบลงได้ ทำให้เราสามารถส่งมอบได้อย่างรวดเร็วพร้อม false positives ที่น้อยมาก เราเลือกใช้เกราะป้องกันที่มองไม่เห็นด้วยเหตุผลนี้—และนั่นคือความสมดุลที่แลกผิด คุณควรได้รับความชัดเจนเกี่ยวกับเกราะป้องกันที่เรามีอยู่ และเหตุผล เราขอโทษที่ทำให้สมดุลไม่ถูกต้อง”

Claude Fable 5 เดิมใช้การลดทอนคำตอบแบบเงียบ

เกราะป้องกันในการพัฒนา LLM จะตรวจพบเมื่อผู้ใช้กำลังทำงานกับระบบ AI สำหรับการเทรนล่วงหน้า การสร้างโครงสร้างพื้นฐานการเทรนแบบกระจาย หรือการออกแบบชิปสำหรับการเรียนรู้ของเครื่อง โมเดลจะปรับเปลี่ยนพฤติกรรมของตัวเองอย่างเงียบ ๆ ผ่านการปรับข้อความใน prompt การปรับ steering vectors หรือการปรับพารามิเตอร์เพื่อให้ได้คำตอบที่แย่ลงโดยไม่แจ้งให้ผู้ใช้ทราบ ผู้ใช้ยังได้รับคำตอบ แต่ไม่ใช่คำตอบจาก Fable 5 ที่พวกเขาจ่ายเพื่อใช้งาน Claude Fable 5 มีเกราะป้องกันที่มองเห็นได้อยู่แล้วสำหรับงานวิจัยด้านความปลอดภัยทางไซเบอร์และชีววิทยา ซึ่งจะแจ้งผู้ใช้เมื่อคำขอถูกส่งต่อไปยังโมเดล Opus 4.8 รุ่นเก่า ปัญหาเรื่องความแม่นยำของตัวจัดประเภททำให้การทำงานด้านการเรียนรู้ของเครื่องที่ถูกต้องตามกฎหมายถูกตั้งค่าสถานะ เกิดปัญหาด้านการทำซ้ำสำหรับนักวิจัย AI ที่ไม่มีทางรู้ว่าผลลัพธ์ของพวกเขาถูกปนเปื้อน

ระบบใหม่ส่งคำขอที่ถูกตั้งค่าสถานะไปยัง Claude Opus 4.8

ตอนนี้คำขอที่ถูกตั้งค่าสถานะจะถูกส่งต่อแบบมองเห็นได้ไปยัง Opus 4.8 ซึ่งเหมือนกับเกราะป้องกันสำหรับงานวิจัยด้านไซเบอร์และชีววิทยาของบริษัท ผู้ใช้จะเห็นการแจ้งเตือนนี้ทุกครั้งที่เกิดขึ้น สำหรับฝั่ง API คำขอที่ถูกตั้งค่าสถานะทั้งหมดจะคืนเหตุผลในการปฏิเสธแทนการส่งคำตอบที่ถูกลดทอนแบบเงียบ ๆ Anthropic กำลังปรับใช้การเปลี่ยนแปลงแบบเดียวกันกับตัวจัดประเภทด้านชีววิทยาและความปลอดภัยทางไซเบอร์ ซึ่งเคยได้รับคำร้องเรียนเกี่ยวกับการตั้งค่าสถานะกับคำสั่งวิจัยที่ไม่เป็นอันตราย

Anthropic ยอมรับ false positives ที่เพิ่มขึ้นจากเกราะป้องกันที่มองเห็นได้

Anthropic ยอมรับโดยตรงถึงความสมดุลที่กำลังยอมรับอยู่: การทำให้เกราะป้องกันมองเห็นได้ง่ายขึ้นต่อการถูกเลี่ยง ซึ่งหมายความว่าตัวจัดประเภทต้องกวาดเกณฑ์ให้กว้างขึ้นเพื่อให้ยังมีประสิทธิภาพ false positives ที่มากขึ้น—งานด้าน machine-learning ที่ถูกต้องซึ่งกลับถูกจับและส่งต่อ—กำลังจะเกิดขึ้นในขณะที่บริษัทจูนระบบของตน Anthropic กล่าวว่ากำลังพยายามลด false positives “ให้เร็วที่สุดเท่าที่เป็นไปได้” แต่ไม่ได้ระบุไทม์ไลน์ Fable 5 ยังคงให้ใช้ฟรีในแผน Pro, Max, Team และ Enterprise จนถึงวันที่ 22 มิถุนายน หลังจากนั้นจะเปลี่ยนไปใช้งานเครดิตสำหรับ API เท่านั้น

FAQ

สัปดาห์นี้ Anthropic เปลี่ยนอะไรเกี่ยวกับเกราะป้องกันของ Claude Fable 5?

Anthropic ประกาศว่าตั้งแต่สัปดาห์นี้ คำขอที่ถูกตั้งค่าสถานะจะถูกส่งไปยัง Claude Opus 4.8 อย่างชัดเจนแทนการส่งผลลัพธ์ที่ถูกลดทอนแบบเงียบ ๆ ผู้ใช้งานฝั่ง API จะได้รับเหตุผลที่ระบุเมื่อคำขอถูกปฏิเสธ และการแจ้งเตือนการส่งต่อแบบ fallback ฝั่งเซิร์ฟเวอร์จะทยอยเปิดตัวในไม่กี่วันข้างหน้า

ทำไม Anthropic ถึงขอโทษสำหรับเกราะป้องกันดั้งเดิมของ Claude Fable 5?

Anthropic ขอโทษเพราะเกราะป้องกันที่มองไม่เห็นสำหรับการพัฒนา LLM ของโมเดลได้ลดทอนคำตอบอย่างลับโดยไม่แจ้งผู้ใช้ ซึ่งบริษัทยอมรับว่าเป็น “ความสมดุลที่แลกผิด” เกราะป้องกันถูกซ่อนอยู่ในเอกสารระบบความยาว 319 หน้า และทำให้เกิดปัญหาด้านการทำซ้ำสำหรับนักวิจัย AI ที่ทำงานถูกต้องตามกฎหมาย ซึ่งไม่มีทางรู้ว่าผลลัพธ์ของพวกเขาถูกปนเปื้อน

การเข้าถึงแบบใช้ฟรีของ Claude Fable 5 จะสิ้นสุดเมื่อไร?

Fable 5 ยังคงฟรีในแผน Pro, Max, Team และ Enterprise จนถึงวันที่ 22 มิถุนายน หลังจากนั้นจะเปลี่ยนไปใช้งานเครดิตสำหรับ API เท่านั้น

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น