ตามการตรวจสอบ Beating Monitoring ของ Zhipu ได้รายงานว่ามีปัญหาเกี่ยวกับตัวอักษรผิดปกติ การซ้ำซ้อน และอักษรที่ไม่ค่อยพบในโมเดล GLM-5 ซีรีส์ในบริบทของ Coding Agent ตั้งแต่เดือนมีนาคมเป็นต้นมา มีผู้ใช้งานรายงานว่าปัญหาเกิดขึ้นเฉพาะในงาน Coding Agent ที่มีการประมวลผลพร้อมกันสูงและมีบริบทยาว (เฉลี่ยเกิน 70K โทเคน) เท่านั้น ไม่สามารถทำซ้ำได้ในสภาพแวดล้อมการอนุมานมาตรฐาน Zhipu ระบุว่าระบบการอนุมานของตนรับภาระการเรียกใช้งาน Coding Agent วันละหลายร้อยล้านครั้ง

หลังจากการตรวจสอบหลายสัปดาห์ ทีมงานได้ระบุจุดบกพร่องสองจุดที่เป็น race condition ในระดับพื้นฐานที่แยกจากกัน จุดแรกเกิดขึ้นในสถาปัตยกรรม PD แยก (แยกการเติมข้อมูลล่วงหน้าและการถอดรหัสไปยังโหนดต่าง ๆ): เมื่อฝั่งการถอดรหัสหยุดคำขอชั่วคราวเนื่องจากหมดเวลาแล้วจะทำการเก็บ KV Cache (แคชสถานะความสนใจที่คำนวณแล้วเพื่อหลีกเลี่ยงการคำนวณซ้ำ) แต่ฝั่งการเติมข้อมูลล่วงหน้าการเขียน RDMA ยังไม่เสร็จสมบูรณ์ คำขอใหม่จะถูกจัดสรรไปยังหน่วยความจำ GPU เดียวกัน ข้อมูลเก่าแทนที่ข้อมูลใหม่ วิธีการแก้ไขคือเพิ่มการซิงโครไนซ์แบบชัดเจนก่อนการเก็บข้อมูล เพื่อยืนยันว่าการเขียนเสร็จสมบูรณ์ก่อนปล่อย หลังจากอัปเดตอัตราความผิดปกติลดลงจากประมาณ 0.1% เหลือไม่ถึง 0.03%

จุดบกพร่องที่สองเกิดขึ้นใน HiCache (แคช KV หลายระดับ): เมื่อโหลดข้อมูลจากหน่วยความจำ CPU เข้าสู่แคชแบบอะซิงโครนัส ระหว่างสายการผลิตการโหลดและการคำนวณขาดจุดซิงโครไนซ์ ทำให้ฝั่งการคำนวณอาจเริ่มอ่านข้อมูลก่อนที่ข้อมูลจะโหลดเสร็จสมบูรณ์ หลังจากการแก้ไข ปัญหานี้ก็หายไปอย่างสมบูรณ์ และแพตช์ได้ถูกส่งไปยังชุมชน SGLang (PR #22811)

ระหว่างการตรวจสอบ ยังพบสิ่งที่ไม่คาดคิดอีกด้วย: ตัวชี้วัดอัตราการรับคำ (acceptance rate) ของเทคนิคการ sampling แบบคาดการณ์ (ใช้โมเดลเล็กทายโทเคนก่อนแล้วให้โมเดลใหญ่ตรวจสอบเพื่อเร่งความเร็ว) สามารถใช้เป็นสัญญาณตรวจจับความผิดปกติได้ เมื่อเกิดอักษรผิดปกติ โทเคนร่างจะถูกปฏิเสธเกือบทั้งหมด ในขณะที่ในกรณีซ้ำซ้อน อัตราการรับคำจะสูงผิดปกติ ทีมงานจึงได้ทำการตรวจสอบแบบออนไลน์: เมื่อถึงค่าขีดจำกัดจะหยุดการสร้างอัตโนมัติและทำการรีเทรย์

หลังจากแก้ไขบั๊กแล้ว ทีมงานยังได้ปรับปรุงจุดคอขวดอีกด้วย: การเก็บ KV Cache แบบ LayerSplit ซึ่งเก็บข้อมูลแยกชั้นในแต่ละ GPU โดยแต่ละ GPU จะเก็บเฉพาะบางชั้นของ KV Cache แทนที่จะเก็บทั้งหมด โดยใช้การกระจายข้อมูลเพื่อประสานการคำนวณ ในอัตราการเข้าถึงแคช 90% เมื่อความยาวคำขอเพิ่มจาก 40K เป็น 120K จะทำให้ throughput เพิ่มขึ้น 10% ถึง 132% ยิ่งบริบทยาวขึ้น ผลลัพธ์ก็ยิ่งดีขึ้น

news.article.disclaimer

btc.bar.articles

ตัวแทน Hermes ของ Nous Research เพิ่มฟีเจอร์ Curator เพื่อทำการเกษียณทักษะที่ไม่ได้ใช้งานอัตโนมัติหลัง 30 วัน

AI Agent

ตามรายงานของ Nous Research กรอบ Hermes Agent ได้เพิ่มฟีเจอร์ Curator เมื่อวันที่ 29 เมษายน เพื่อจัดการวงจรการใช้งานทักษะโดยอัตโนมัติ ฟีเจอร์ดังกล่าวช่วยแก้ข้อจำกัดเดิมก่อนหน้านี้ที่ทำให้เอเจนต์ AI สามารถสะสมทักษะได้ไม่สิ้นสุด ส่งผลให้ระบบพราอมพ์บวมขึ้นโดยที่ยังไม่ได้ลบรายการทักษะที่ไม่ได้ใช้งานออก Curator

GateNews37 นาที ที่แล้ว

Grok เปิดตัวโหมด Imagine Agent รุ่นเบตาพร้อม Infinite Canvas สำหรับเวิร์กโฟลว์สร้างสรรค์แบบหลายขั้นตอน

AI Agent

ตามรายงานที่ได้รับการติดตามโดย Beating เวอร์ชันเว็บของ Grok กำลังทยอยเปิดตัว Imagine Agent Mode (เบตา) ซึ่งเป็นเครื่องมือแบบเอเจนต์ใหม่ที่ต่อยอดจากความสามารถเดิมของ xAI ในการสร้างภาพและวิดีโอ โดยอินเทอร์เฟซจะแทนที่หน้าต่างแชตแบบดั้งเดิมด้วยผืนผ้าใบแบบไม่มีที่สิ้นสุด และมีชุดค่าที่ตั้งไว้ล่วงหน้า 4 ชุด

GateNews1 ชั่วโมง ที่แล้ว

Billions Network กลายเป็นระบบนิเวศเอเจนต์ที่ใหญ่เป็นอันดับ 3 ด้วยเอเจนต์ที่ถูกใช้งานมากกว่า 18,000 ราย

AI Agent

ตาม BlockBeats เมื่อวันที่ 30 เมษายน Billions Network ได้กลายเป็นระบบนิเวศ Agent อันดับ 3 ที่ใหญ่ที่สุดตามจำนวนการใช้งาน โดยแซงหน้า Ethereum ด้วยการติดตั้งใช้งานมากกว่า 18,000 เอเจน เครือข่ายอยู่รองจากเพียง BNB Chain และ Base เท่านั้น Billions ยังได้ซิงโครไนซ์ฟีเจอร์ยืนยันตัวตนของ Agent แล้วทั่ว

GateNews3 ชั่วโมง ที่แล้ว

Ant International เชื่อมโยงพ่อค้า 150 ล้านรายผ่านการชำระเงินที่ขับเคลื่อนด้วย AI

AI Agent AI Tools & Apps

Ant International ระบุว่าเครือข่ายการชำระเงินของบริษัทเชื่อมโยงร้านค้ามากกว่า 150 ล้านรายกับบัญชีผู้บริโภคมากกว่า 2 พันล้านบัญชีทั่วโลก รองรับวิธีการชำระเงินมากกว่า 300 ประเภทใน 220 ตลาด บริษัทประมวลผลธุรกรรมมากกว่า 20 ล้านรายการต่อวันโดยเฉลี่ย และกำลังขยายข้ามทวีปในเอเชีย

CryptoFrontier7 ชั่วโมง ที่แล้ว

OKX เปิดตัวโปรโตคอลการชำระเงินสำหรับเอเจนต์ (Agent Payments) เพื่อการค้าบอท AI

ethereum news solana news Project Progress Partnerships & Ecosystem AI Agent

เมื่อวันพุธที่ผ่านมา Crypto exchange OKX ได้เปิดตัว Agent Payments Protocol (APP) ซึ่งเป็นมาตรฐานแบบเปิด ออกแบบมาเพื่อให้เอเจนต์ AI สามารถดำเนินวงจรธุรกิจแบบครบวงจร รวมถึงการชำระเงิน การเจรจา และการระงับข้อพิพาท โปรโตคอลนี้สืบตามข้อเสนอที่คล้ายกันจากคู่แข่งอย่าง x402 ซึ่งถูกบ่มเพาะโดย

CryptoFrontier8 ชั่วโมง ที่แล้ว

Kite เปิดตัวเมนเน็ต พร้อมเปิดตัวเลเยอร์การควบคุมการชำระเงินสำหรับการอนุญาตใช้งาน AI Agent

Project Progress AI Agent

ตามประกาศอย่างเป็นทางการของ Kite โครงสร้างพื้นฐานสำหรับการชำระเงินในเศรษฐกิจของ AI Agent อย่าง Kite ได้เปิดตัวเมนเน็ตอย่างเป็นทางการในวันที่ 30 เมษายน; ระหว่างการเปิดตัวเมนเน็ต Kite Treasury จะเป็นผู้ชำระค่าธรรมเนียมเครือข่าย แสดงว่าผู้ใช้ไม่จำเป็นต้องรับรู้เรื่องแก๊ส (gas) และ Kite ยังเปิดให้สาธารณชนเข้าถึง Kite Agent Passport พร้อมกัน ซึ่งทำหน้าที่เป็นชั้นการอนุญาตและการควบคุมการชำระเงินสำหรับ Agent

MarketWhisper8 ชั่วโมง ที่แล้ว

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น