ข้อความข่าวประตู วันที่ 23 เมษายน — ทีมวิศวกรรมของ Anthropic ยืนยันว่า การเสื่อมคุณภาพของ Claude Code ที่ผู้ใช้รายงานในช่วงเดือนที่ผ่านมาเกิดจากการเปลี่ยนแปลงระดับผลิตภัณฑ์จำนวน 3 รายการที่เป็นอิสระกัน ไม่ใช่ปัญหาจาก API หรือโมเดลพื้นฐาน ปัญหา 3 รายการนี้ได้รับการแก้ไขในวันที่ 7 เมษายน 10 เมษายน และ 20 เมษายน ตามลำดับ โดยเวอร์ชันสุดท้ายตอนนี้อยู่ที่ v2.1.116.
การเปลี่ยนแปลงครั้งแรกเกิดขึ้นเมื่อวันที่ 4 มีนาคม เมื่อทีมลดระดับความพยายามในการให้เหตุผลเริ่มต้นของ Claude Code จาก “high” เป็น “medium” เพื่อแก้ไขเหตุการณ์ที่มีความหน่วงอย่างรุนแรงเป็นบางครั้งใน Opus 4.6 ภายใต้ความเข้มของการให้เหตุผลสูง หลังจากได้รับคำร้องเรียนอย่างแพร่หลายเกี่ยวกับประสิทธิภาพที่ลดลง ทีมจึงย้อนกลับการเปลี่ยนแปลงดังกล่าวในวันที่ 7 เมษายน ปัจจุบันค่าเริ่มต้นคือ “xhigh” สำหรับ Opus 4.7 และ “high” สำหรับโมเดลอื่น ๆ
ปัญหาที่สองเป็นบั๊กที่ถูกแนะนำเมื่อวันที่ 26 มีนาคม ระบบได้รับการออกแบบให้ล้างบันทึกการให้เหตุผลเก่าหลังจากที่กิจกรรมการสนทนาไม่มีเกินหนึ่งชั่วโมง เพื่อลดต้นทุนการกู้คืนเซสชัน อย่างไรก็ตาม ข้อบกพร่องในการนำไปใช้งานทำให้การล้างถูกเรียกซ้ำในทุกเทิร์นถัดไปแทนที่จะเกิดเพียงครั้งเดียว ส่งผลให้โมเดลค่อย ๆ สูญเสียบริบทการให้เหตุผลก่อนหน้า ปรากฏออกมาในรูปแบบของความหลงลืมที่เพิ่มขึ้น การดำเนินการซ้ำ และการเรียกใช้เครื่องมือผิดปกติ บั๊กดังกล่าวยังทำให้เกิดการพลาดแคชในทุกคำขอ ซึ่งเร่งการใช้โควตาผู้ใช้ สองการทดลองภายในที่ไม่เกี่ยวข้องกันทำให้เงื่อนไขการทำซ้ำถูกปกปิด ทำให้กระบวนการดีบักยืดเยื้อไปเกินกว่าหนึ่งสัปดาห์ หลังจากแก้ไขในวันที่ 10 เมษายน ทีมได้ตรวจสอบโค้ดที่มีปัญหาโดยใช้ Opus 4.7 และพบว่า Opus 4.7 สามารถระบุบั๊กได้ ขณะที่ Opus 4.6 ทำไม่ได้
การเปลี่ยนแปลงครั้งที่สามเปิดตัวเมื่อวันที่ 16 เมษายน ควบคู่กับ Opus 4.7 ทีมได้เพิ่มคำแนะนำในพรอมต์ของระบบเพื่อลดเอาต์พุตที่ซ้ำซ้อน การทดสอบภายในในช่วงหลายสัปดาห์ไม่พบการถดถอย แต่หลังการเปิดตัวเมื่อมีปฏิสัมพันธ์กับพรอมต์อื่น ๆ คุณภาพการเขียนโค้ดกลับลดลง การประเมินแบบขยายพบว่าประสิทธิภาพลดลง 3% ทั้งใน Opus 4.6 และ 4.7 ส่งผลให้มีการยกเลิกการเปลี่ยนแปลง (rollback) ในวันที่ 20 เมษายน
การเปลี่ยนแปลงทั้งสามครั้งส่งผลกระทบต่อกลุ่มผู้ใช้ที่แตกต่างกันในช่วงเวลาที่ต่างกัน และผลรวมของมันทำให้เกิดการลดลงของคุณภาพที่แพร่หลายและไม่สม่ำเสมอ ซึ่งทำให้การวินิจฉัยซับซ้อนขึ้น Anthropic ระบุว่าจะต้องให้พนักงานภายในมากขึ้นใช้เวอร์ชันบิลด์สาธารณะเดียวกับผู้ใช้ เรียกใช้ชุดการประเมินโมเดลแบบเต็มสำหรับการปรับเปลี่ยนพรอมต์ของระบบทุกครั้ง และนำช่วงการทยอยเปิดตัวแบบเป็นขั้นตอนไปใช้ ในฐานะค่าชดเชย Anthropic ได้รีเซ็ตโควตาการใช้งานสำหรับผู้ใช้สมาชิกทั้งหมดแล้ว
btc.bar.articles
ศาลในแคลิฟอร์เนียพิจารณาคดีที่มาสก์ฟ้อง OpenAI โดยซีอีโอของไมโครซอฟต์จะขึ้นให้การในศาล
Samsung SDS ได้รับสิทธิในการจำหน่าย ChatGPT Edu ของ OpenAI ในเกาหลีใต้
อินเดียเปิดตัวโครงการเมืองเอไอ $650M ในบังกาลอร์ มุ่งเป้าสร้างนักวิจัย 25,000 คนภายในปี 2030
แซม อัลต์แมน เผยโครงร่างหลักการการดำเนินงาน 5 ประการของ OpenAI พร้อมส่งสัญญาณข้อจำกัดความสามารถของโมเดลที่อาจเกิดขึ้นในอนาคตเพื่อความปลอดภัย
DeepSeek เลื่อนการเปิดตัว V4 เพื่อปรับให้เข้ากับชิป Ascend ของ Huawei
DeepSeek ตัดราคาค่าแคชอินพุตเหลือ 1/10 ของราคาตอนเปิดตัว; V4-Pro เหลือ 0.025 หยวนต่อหนึ่งล้านโทเค็น