Anthropic ระบุการเปลี่ยนแปลงระดับผลิตภัณฑ์ 3 รายการที่อยู่เบื้องหลังการลดลงของคุณภาพ Claude Code ไม่ใช่ปัญหาโมเดล

ข้อความข่าวประตู วันที่ 23 เมษายน — ทีมวิศวกรรมของ Anthropic ยืนยันว่า การเสื่อมคุณภาพของ Claude Code ที่ผู้ใช้รายงานในช่วงเดือนที่ผ่านมาเกิดจากการเปลี่ยนแปลงระดับผลิตภัณฑ์จำนวน 3 รายการที่เป็นอิสระกัน ไม่ใช่ปัญหาจาก API หรือโมเดลพื้นฐาน ปัญหา 3 รายการนี้ได้รับการแก้ไขในวันที่ 7 เมษายน 10 เมษายน และ 20 เมษายน ตามลำดับ โดยเวอร์ชันสุดท้ายตอนนี้อยู่ที่ v2.1.116.

การเปลี่ยนแปลงครั้งแรกเกิดขึ้นเมื่อวันที่ 4 มีนาคม เมื่อทีมลดระดับความพยายามในการให้เหตุผลเริ่มต้นของ Claude Code จาก “high” เป็น “medium” เพื่อแก้ไขเหตุการณ์ที่มีความหน่วงอย่างรุนแรงเป็นบางครั้งใน Opus 4.6 ภายใต้ความเข้มของการให้เหตุผลสูง หลังจากได้รับคำร้องเรียนอย่างแพร่หลายเกี่ยวกับประสิทธิภาพที่ลดลง ทีมจึงย้อนกลับการเปลี่ยนแปลงดังกล่าวในวันที่ 7 เมษายน ปัจจุบันค่าเริ่มต้นคือ “xhigh” สำหรับ Opus 4.7 และ “high” สำหรับโมเดลอื่น ๆ

ปัญหาที่สองเป็นบั๊กที่ถูกแนะนำเมื่อวันที่ 26 มีนาคม ระบบได้รับการออกแบบให้ล้างบันทึกการให้เหตุผลเก่าหลังจากที่กิจกรรมการสนทนาไม่มีเกินหนึ่งชั่วโมง เพื่อลดต้นทุนการกู้คืนเซสชัน อย่างไรก็ตาม ข้อบกพร่องในการนำไปใช้งานทำให้การล้างถูกเรียกซ้ำในทุกเทิร์นถัดไปแทนที่จะเกิดเพียงครั้งเดียว ส่งผลให้โมเดลค่อย ๆ สูญเสียบริบทการให้เหตุผลก่อนหน้า ปรากฏออกมาในรูปแบบของความหลงลืมที่เพิ่มขึ้น การดำเนินการซ้ำ และการเรียกใช้เครื่องมือผิดปกติ บั๊กดังกล่าวยังทำให้เกิดการพลาดแคชในทุกคำขอ ซึ่งเร่งการใช้โควตาผู้ใช้ สองการทดลองภายในที่ไม่เกี่ยวข้องกันทำให้เงื่อนไขการทำซ้ำถูกปกปิด ทำให้กระบวนการดีบักยืดเยื้อไปเกินกว่าหนึ่งสัปดาห์ หลังจากแก้ไขในวันที่ 10 เมษายน ทีมได้ตรวจสอบโค้ดที่มีปัญหาโดยใช้ Opus 4.7 และพบว่า Opus 4.7 สามารถระบุบั๊กได้ ขณะที่ Opus 4.6 ทำไม่ได้

การเปลี่ยนแปลงครั้งที่สามเปิดตัวเมื่อวันที่ 16 เมษายน ควบคู่กับ Opus 4.7 ทีมได้เพิ่มคำแนะนำในพรอมต์ของระบบเพื่อลดเอาต์พุตที่ซ้ำซ้อน การทดสอบภายในในช่วงหลายสัปดาห์ไม่พบการถดถอย แต่หลังการเปิดตัวเมื่อมีปฏิสัมพันธ์กับพรอมต์อื่น ๆ คุณภาพการเขียนโค้ดกลับลดลง การประเมินแบบขยายพบว่าประสิทธิภาพลดลง 3% ทั้งใน Opus 4.6 และ 4.7 ส่งผลให้มีการยกเลิกการเปลี่ยนแปลง (rollback) ในวันที่ 20 เมษายน

การเปลี่ยนแปลงทั้งสามครั้งส่งผลกระทบต่อกลุ่มผู้ใช้ที่แตกต่างกันในช่วงเวลาที่ต่างกัน และผลรวมของมันทำให้เกิดการลดลงของคุณภาพที่แพร่หลายและไม่สม่ำเสมอ ซึ่งทำให้การวินิจฉัยซับซ้อนขึ้น Anthropic ระบุว่าจะต้องให้พนักงานภายในมากขึ้นใช้เวอร์ชันบิลด์สาธารณะเดียวกับผู้ใช้ เรียกใช้ชุดการประเมินโมเดลแบบเต็มสำหรับการปรับเปลี่ยนพรอมต์ของระบบทุกครั้ง และนำช่วงการทยอยเปิดตัวแบบเป็นขั้นตอนไปใช้ ในฐานะค่าชดเชย Anthropic ได้รีเซ็ตโควตาการใช้งานสำหรับผู้ใช้สมาชิกทั้งหมดแล้ว

news.article.disclaimer

btc.bar.articles

Cognition AI ระดมทุนที่ $25B มูลค่าในช่วงเจรจาระยะเริ่มต้น

ข้อความจาก Gate News ประจำวันที่ 24 เมษายน — Cognition AI สตาร์ทอัพด้านการเขียนโค้ดด้วย AI กำลังอยู่ระหว่างการเจรจาในระยะเริ่มต้นสำหรับรอบการระดมทุนใหม่ ซึ่งจะทำให้มูลค่าเพิ่มขึ้นมากกว่าสองเท่าจาก $25 พันล้าน ตามแหล่งข่าวที่คุ้นเคยกับเรื่องนี้ บริษัทตั้งเป้าระดมทุนหลายร้อยล้านดอลลาร์หรือมากกว่านั้น ในขณะที่ความต้องการเทคโนโลยี AI เชิงสร้างสรรค์ในด้านการพัฒนาซอฟต์แวร์ยังคงเติบโตอย่างต่อเนื่อง

GateNews59 นาที ที่แล้ว

บริษัท NEC จะกลายเป็นคู่ค้าร่วมระดับโลกรายแรกของ Anthropic ในญี่ปุ่น

NEC ประกาศว่าจะเป็นพันธมิตรระดับโลกรายแรกของ Anthropic ในญี่ปุ่น ทั้งสองฝ่ายจะพัฒนาโซลูชัน AI ที่ปลอดภัยและมีความเชี่ยวชาญด้านอุตสาหกรรมสำหรับอุตสาหกรรมที่มีการกำกับดูแลอย่างเข้มงวด เช่น การเงิน การผลิต และหน่วยงานรัฐบาลท้องถิ่น พร้อมทั้งบูรณาการตระกูล Claude เข้ากับ NEC BluStellar โดยมุ่งเน้นการเปลี่ยนผ่านด้านการจัดการที่ขับเคลื่อนด้วยข้อมูลและประสบการณ์ของลูกค้า ขณะเดียวกันยังนำ Claude Cowork และการบูรณาการ SOC มาใช้เพื่อยกระดับการป้องกันความปลอดภัยทางไซเบอร์ เพื่อเป็นการยืนยันผลลัพธ์ NEC ได้เริ่มโครงการลูกค้ารายที่ศูนย์ (Zero-n) เพื่อทำการทดสอบอย่างครอบคลุมภายในองค์กรของ AI เอเจนต์ และวางแผนขยายการใช้งาน Claude ในระดับโลก สร้างศูนย์ความเป็นเลิศ (CoE) ด้านวิศวกร AI แบบเนทีฟที่มีขนาดใหญ่ที่สุดในญี่ปุ่น

ChainNewsAbmedia3 ชั่วโมง ที่แล้ว

การรั่วไหลด้านความปลอดภัยของ Vercel ขยายวงสู่ผู้ใช้หลายร้อยคน; นักพัฒนา AI เสี่ยงสูงขึ้น

ข้อความข่าว Gate วันที่ 23 เมษายน——Vercel เปิดเผยเมื่อวันที่ 19 เมษายนว่าเหตุการณ์ด้านความปลอดภัย ซึ่งเดิมอธิบายว่า “กระทบลูกค้ากลุ่มจำกัด” ได้ขยายวงกว้างไปสู่ชุมชนนักพัฒนาซอฟต์แวร์ที่กว้างขึ้นมาก โดยเฉพาะผู้ที่กำลังสร้างเวิร์กโฟลว์ของเอเจนต์ AI การโจมตีอาจกระทบผู้ใช้หลายร้อยคน

GateNews4 ชั่วโมง ที่แล้ว

OpenAI เปิดตัว GPT-5.5: บริบท 12M, ดัชนี AA ขึ้นอันดับหนึ่ง, และ Terminal-Bench 82.7% ปรับปรุงมาตรฐานพร็อกซีใหม่

OpenAI ประกาศ GPT-5.5 โดยเน้นการทำงานแบบตัวแทน (agentic) และการจัดการความรู้ขององค์กร และเปิดตัวพร้อมกันใน ChatGPT และ Codex จุดเด่นได้แก่ หน้าต่างบริบท 1200 ล้าน token, AA Intelligence Index 60, นำหน้า Claude Opus 4.7 และ Gemini 3.1 Pro ราคาอยู่ที่ 5 ดอลลาร์สหรัฐต่อทุก 1 ล้าน token สำหรับการป้อน และ 30 ดอลลาร์สหรัฐต่อทุก 1 ล้าน token สำหรับการส่งออก โดยจำนวน token ที่ส่งออกลดลงประมาณ 40% และต้นทุนที่แท้จริงเพิ่มขึ้นประมาณ 20%

ChainNewsAbmedia5 ชั่วโมง ที่แล้ว

Cluster Protocol ระดมทุน $5M เพื่อเร่ง CodeXero สตูดิโอ IDE สำหรับ AI แบบเนทีฟในเบราว์เซอร์ของ EVM

ข้อความจาก Gate News ประจำวันที่ 23 เมษายน — Cluster Protocol บริษัทโครงสร้างพื้นฐานสำหรับ AI deeptech และ Web3 ประกาศว่าได้ระดมทุน $5 ล้านดอลลาร์ในการระดมทุนรอบใหม่ นำโดย DAO5 โดยมี Paper Ventures, JPEG Trading และ Mapleblock Capital เข้าร่วม ส่งผลให้เงินทุนรวมอยู่ที่ 7.75 ล้านดอลลาร์ ทุนดังกล่าวจะ

GateNews5 ชั่วโมง ที่แล้ว

Nvidia ขยายความร่วมมือด้าน AI ในสหราชอาณาจักร จีน และภาคยานยนต์ ท่ามกลางความท้าทายของห่วงโซ่อุปทาน

ข้อความจาก Gate News วันที่ 23 เมษายน — แม้จะมีการแข่งขันจาก Google และการหยุดชะงักของห่วงโซ่อุปทาน แต่ Nvidia ยังคงเป็นผู้เล่นรายเด่นในฮาร์ดแวร์ด้าน AI TD Cowen ได้ยืนยันอันดับซื้อสำหรับ Nvidia อีกครั้งในวันพฤหัสบดี โดยอ้างถึงความเป็นผู้นำของบริษัททั้งในด้านประสิทธิภาพและความกว้างของระบบนิเวศซอฟต์แวร์ คำรับรองดังกล่าว

GateNews5 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น