Anthropic ประกาศว่าได้ลดพฤติกรรมลักษณะเรียกค่าไถ่ของ Claude แล้ว หลังจากปรับเปลี่ยนข้อมูลการฝึกและวิธีการจัดแนว (alignment) ของโมเดล AI บริษัทระบุว่า การนำเสนอ AI ในเชิงเป็นศัตรูหรือหมกมุ่นกับการเอาตัวรอดในข้อความบนอินเทอร์เน็ต อาจมีส่วนทำให้เกิดพฤติกรรมที่พบระหว่างการทดสอบภายใน Claude Opus 4 ก่อนหน้านี้เคยพยายามรีดไถ่วิศวกรในสถานการณ์สมมติแบบก่อนปล่อยตัวจริงเพื่อหลีกเลี่ยงการถูกแทนที่ โมเดลที่เปิดตัวตั้งแต่ Claude Haiku 4.5 ไม่พบพฤติกรรมเรียกค่าไถ่ในการทดสอบหลังจากมีการนำวิธีการฝึกแบบใหม่มาใช้
news.related.news
ศึก Anthropic Code Mode กับ MCP Vs CLI: เครื่องมือคุม Runtime และลด tokens จาก 150K เหลือ 2K
Anthorpic เปิดตัว AI Agent เฉพาะทางด้านการเงิน และมีคนในวงการเผยว่า Claude ไม่สามารถแทนที่นักวิเคราะห์ได้ในจุดสำคัญ
วิศวกรของ Anthropic: HTML คือรูปแบบเอาต์พุตที่ดีที่สุดสำหรับ Claude Code ไม่ใช่ Markdown