Ramp Labs เสนอแนวทางใหม่สำหรับการแชร์หน่วยความจำแบบหลายเอเจนต์ โดยการใช้โทเคนสูงสุดลดลง 65%

GateNews

ข่าว Gate News วันที่ 11 เมษายน บริษัทโครงสร้างพื้นฐานด้าน AI Ramp Labs เปิดเผยผลการวิจัย “Latent Briefing” โดยบีบอัดแคช KV ของโมเดลขนาดใหญ่โดยตรงเพื่อทำให้เกิดการแชร์ความจำอย่างมีประสิทธิภาพระหว่างระบบหลายเอเจนต์ (multi-agent) ภายใต้เงื่อนไขที่ไม่ทำให้ความแม่นยกลดลง และลดการใช้ Token ได้อย่างมาก ในสถาปัตยกรรมหลายเอเจนต์ที่เป็นกระแสหลัก ผู้ประสานงาน (Orchestrator)จะแยกงานออกและเรียกใช้โมเดลผู้ปฏิบัติงาน (Worker)ซ้ำ ๆ เมื่อระยะเส้นทางการอนุมาน (inference) ยาวขึ้น ปริมาณ Token ก็จะเพิ่มขึ้นแบบทวีคูณ Latent Briefing มีแนวคิดหลักคือใช้กลไกความสนใจ (attention) เพื่อระบุส่วนที่สำคัญจริง ๆ ในบริบท จากนั้นจึงทิ้งข้อมูลที่ซ้ำซ้อนทันทีในชั้นการแทนค่า (representation) ไม่ใช่พึ่งพาสรุปด้วย LLM ที่ช้ากว่า หรือการค้นคืน RAG ที่เสถียรภาพต่ำ ในการทดสอบเกณฑ์มาตรฐาน LongBench v2 วิธีนี้ทำผลงานได้เด่น: การใช้ Token ของโมเดล Worker ลดลง 65% การประหยัด Token สำหรับเอกสารความยาวปานกลาง (32k ถึง 100k) มีค่ามัธยฐานอยู่ที่ 49% ความแม่นยำโดยรวมสูงขึ้นประมาณ 3 จุดเปอร์เซ็นต์เมื่อเทียบกับฐาน (baseline) และเวลาเพิ่มเติมที่ใช้สำหรับการบีบอัดแต่ละครั้งอยู่ที่ราว 1.7 วินาทีเท่านั้น ทำให้เร็วขึ้นประมาณ 20 เท่าจากอัลกอริทึมเดิม การทดลองใช้ Claude Sonnet 4 เป็นผู้ประสานงาน และ Qwen3-14B เป็นโมเดลผู้ปฏิบัติงาน ครอบคลุมสถานการณ์เอกสารหลายประเภท เช่น บทความวิชาการ เอกสารทางกฎหมาย นวนิยาย และรายงานของรัฐบาล งานวิจัยยังพบว่า “ขีดจำกัดการบีบอัดที่เหมาะสมที่สุด” จะแตกต่างกันตามความยากของงานและความยาวของเอกสาร—งานที่ยากเหมาะกับการบีบอัดแบบก้าวร้าวเพื่อกรองสัญญาณรบกวนจากการอนุมานเชิงคาดเดา (speculative) ขณะที่เอกสารยาวเหมาะกับการบีบอัดแบบเบาเพื่อคงรักษาข้อมูลสำคัญที่กระจายอยู่

news.article.disclaimer

btc.bar.articles

Sahara AI เปิดตัวเอเจนต์การลงทุน Sorin รองรับคริปโต หุ้น และตลาดการคาดการณ์

Sahara AI ได้เปิดตัว Sorin ซึ่งเป็นเอเจนต์การลงทุนสำหรับการเทรดข้ามสินทรัพย์ต่างๆ เช่น สกุลเงินดิจิทัลและหุ้น โดยมีบริการการเทรดแบบอัตโนมัติ การทำให้กลยุทธ์เชิงปริมาณเป็นอัตโนมัติ และการบริหารความเสี่ยงแบบเฉพาะบุคคลสำหรับผู้ใช้งานทุกคน หลังจากการทดสอบกับผู้เข้าร่วม 20,000 คน

GateNews8 ชั่วโมง ที่แล้ว

AlphaNet ระดมทุนรอบ $10M Seed นำโดย Joffre Capital เพื่อเปิดตัวแพลตฟอร์มการเทรดเชิงปริมาณระดับสถาบัน

แพลตฟอร์มเทรดดิ้งเชิงปริมาณด้วย AI AlphaNet ระดมทุนเมล็ดพันธุ์ $10 ล้านดอลลาร์สำเร็จ เตรียมเปิดตัวสาธารณะด้วยกลยุทธ์ที่ทำผลงานได้สูงมากกว่า 30 กลยุทธ์ แผนดังกล่าวรวมถึง Open Platform สำหรับการบูรณาการกลยุทธ์ภายในปี 2026 โดยมุ่งเป้าไปที่มากกว่า 100 กลยุทธ์

GateNews10 ชั่วโมง ที่แล้ว

สตาร์ทอัพการปฏิบัติตามกฎระเบียบด้านฟินเทค Spektr ระดมทุนรอบ Series A $20M โดยมี NEA เป็นผู้นำ

สตาร์ทอัพด้านการปฏิบัติตามกฎระเบียบของฟินเทค Spektr ได้รับเงินทุน $20 ล้าน ในรอบระดมทุน Series A โดยมี NEA เป็นผู้นำ และได้รับการเข้าร่วมจาก Northzone, Seedcamp และ PSV Tech ทำให้ยอดเงินทุนรวมอยู่ที่ $26 ล้าน บริษัทให้บริการด้านการปฏิบัติตามกฎระเบียบที่ขับเคลื่อนด้วย AI สำหรับทั้งภาคการเงินคริปโทเคอร์เรนซีและการเงินแบบดั้งเดิม

GateNews13 ชั่วโมง ที่แล้ว

Claw Wallet ร่วมมือกับ GoPlus เพื่อบูรณาการ SafuSkill และ AgentGuard สำหรับความปลอดภัยของเอเจนต์ AI

Claw Wallet ได้ร่วมมือกับ GoPlus เพื่อยกระดับความปลอดภัยของ AI Agent และแรงจูงใจภายในระบบนิเวศ ความร่วมมือนี้รวมถึงการผสาน SafuSkill Launchpad ของ GoPlus และการนำ AgentGuard มาใช้สำหรับการติดตามความปลอดภัยแบบเรียลไทม์ โดยมีเป้าหมายเพื่อเพิ่มความปลอดภัยของวอลเล็ตและรางวัล

GateNews13 ชั่วโมง ที่แล้ว

AIA(DeAgentAI)ผลิตภัณฑ์การเงินประจำบน Gate เข้าสู่ระบบแล้ว อัตราผลตอบแทนต่อปีสูงสุดถึง 25%

Gate News 消消息 ตามประกาศทางการของ Gate Gate Yubibao ได้เปิดให้บริการผลิตภัณฑ์การลงทุนแบบประจำของ AIA แล้ว โดยมีรอบระยะเวลาล็อก 3 แบบคือ 7 วัน, 14 วัน และ 30 วัน อัตราผลตอบแทนต่อปีสูงสุดอยู่ที่ 25% เงินลงทุนขั้นต่ำเริ่มต้นที่ 10 AIA DeAgentAI คือโครงสร้างพื้นฐานสำหรับเอเจนต์ AI ที่ครอบคลุมระบบนิเวศ Sui, BSC และ BTC โดยมอบความสามารถในการตัดสินใจอย่างอิสระแบบไม่ต้องเชื่อถือบนเชน ให้กับเอเจนต์ AI ดอกเบี้ยจะจ่ายเป็นรูปแบบ AIA ให้กับผู้ใช้ที่เข้าร่วม

GateAnnouncement13 ชั่วโมง ที่แล้ว

Adobe เปิดตัวผู้ช่วย AI Firefly เพื่อทำให้เวิร์กโฟลว์สร้างสรรค์หลายแอปเป็นอัตโนมัติ

ผู้ช่วย AI ของ Adobe Firefly ทำให้งานอัตโนมัติใน Photoshop, Premiere, Lightroom และ Illustrator ผ่านคำสั่งภาษาธรรมชาติ โดยจะยกระดับความสามารถในการแก้ไขด้วยโมเดล AI มากกว่า 30 รุ่น และรวมเข้ากับ Adobe Stock ซึ่งถือเป็นการเปลี่ยนผ่านไปสู่ความคิดสร้างสรรค์แบบเชิงตัวแทนสำหรับผู้ใช้งาน

GateNews15 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น