Google Research เปิดตัว ReasoningBank: เอเจนต์ AI เรียนรู้กลยุทธ์การให้เหตุผลจากความสำเร็จและความล้มเหลว

ข่าว Gate News วันที่ 22 เมษายน — Google Research เปิดตัว ReasoningBank ซึ่งเป็นกรอบงานหน่วยความจำของเอเจนต์ที่ช่วยให้เอเจนต์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่สามารถเรียนรู้อย่างต่อเนื่องหลังการใช้งานจริง กรอบงานจะสกัดกลยุทธ์การให้เหตุผลทั่วไปจากทั้งประสบการณ์ที่ทำสำเร็จและที่ทำไม่สำเร็จ โดยเก็บไว้ในแหล่งหน่วยความจำเพื่อใช้ค้นคืนและดำเนินการในงานในอนาคตที่คล้ายกัน กระดาษที่เกี่ยวข้องถูกเผยแพร่ที่ ICLR และโค้ดถูกเปิดซอร์สบน GitHub.

ReasoningBank พัฒนาต่อยอดจากแนวทางที่มีอยู่ 2 แบบ ได้แก่ Synapse ซึ่งบันทึกเส้นทางการกระทำแบบครบถ้วนแต่มีความสามารถในการถ่ายโอนจำกัดเนื่องจากความละเอียดที่ละเอียดเกินไป และ Agent Workflow Memory ซึ่งเรียนรู้จากกรณีที่ทำสำเร็จเท่านั้น ReasoningBank ทำการเปลี่ยนแปลงสำคัญ 2 ประการ: การเก็บ “รูปแบบการให้เหตุผล” แทนที่จะเป็น “ลำดับการกระทำ” โดยหน่วยความจำแต่ละรายการมีฟิลด์เชิงโครงสร้างสำหรับชื่อ คำอธิบาย และเนื้อหา; และการนำเส้นทางที่ล้มเหลวมาใช้ในการเรียนรู้ กรอบงานใช้โมเดลเพื่อประเมินเส้นทางการปฏิบัติอย่างละเอียดด้วยตัวเอง แปลงประสบการณ์ความล้มเหลวให้กลายเป็นกฎเพื่อหลีกเลี่ยงกับดัก ตัวอย่างเช่น กฎ “คลิกปุ่ม Load More เมื่อเห็น” จะพัฒนาไปเป็น “ตรวจสอบตัวระบุหน้าปัจจุบันก่อน หลีกเลี่ยงลูปการเลื่อนอย่างไม่สิ้นสุด แล้วค่อยคลิก load more”

บทความยังนำเสนอ Memory-aware Test-time Scaling (MaTTS) ซึ่งจัดสรรกำลังประมวลผลเพิ่มเติมระหว่างการอนุมานเพื่อสำรวจเส้นทางหลายแบบ และจัดเก็บข้อค้นพบไว้ในแหล่งหน่วยความจำ การขยายแบบขนานรันเส้นทางที่แตกต่างกันหลายชุดสำหรับงานเดียวกัน โดยปรับปรุงกลยุทธ์ที่ทนทานยิ่งขึ้นผ่านการเปรียบเทียบด้วยตนเอง ส่วนการขยายแบบต่อเนื่องจะปรับปรุงเส้นทางเดียวแบบวนซ้ำ โดยเก็บเหตุผลระดับกลางไว้ในหน่วยความจำ.

ในงานท่องเว็บของ WebArena และงานโค้ดดิ้ง SWE-Bench-Verified โดยใช้ Gemini 2.5 Flash เป็นเอเจนต์แบบ ReAct ReasoningBank ทำอัตราความสำเร็จได้สูงขึ้น 8.3% บน WebArena และสูงขึ้น 4.6% บน SWE-Bench-Verified เมื่อเทียบกับฐานที่ไม่มีหน่วยความจำ ลดจำนวนขั้นเฉลี่ยต่อภารกิจลงประมาณ 3 เมื่อเพิ่ม MaTTS ด้วยการขยายแบบขนาน (k=5) ยิ่งทำให้อัตราความสำเร็จบน WebArena ดีขึ้นอีก 3 จุดเปอร์เซ็นต์ และลดขั้นเพิ่มเติมได้อีก 0.4.

news.article.disclaimer

btc.bar.articles

Microsoft เปิดตัวโครงสร้างพื้นฐานพาณิชย์สำหรับตัวแทน AI: Marketplace ของผู้เผยแพร่ โปรโตคอลสำหรับผู้ค้า และเครื่องมือโฆษณา

อัปเดตข่าว Gate News วันที่ 22 เมษายน — ทิม แฟรงก รองประธานฝ่ายสร้างรายได้จาก AI ของไมโครซอฟต์ ประกาศชุดอัปเดตโครงสร้างพื้นฐานเชิงพาณิชย์ที่ออกแบบมาเพื่อยุค "agentic web" โดยทำให้ผู้เผยแพร่ ผู้ค้า และผู้โฆษณายังคงเป็นสิ่งที่ค้นพบได้และซื้อขายได้ ขณะที่ตัวแทน AI ตัดสินใจในการสั่งซื้อแทนผู้ใช้งานบน

GateNews9 นาที ที่แล้ว

NeoCognition ระดมทุน $40M ล้านดอลลาร์ในรอบเมล็ดพันธุ์สำหรับเอเจนต์ AI ที่เรียนรู้จากงานจริง

Gate News ข้อความ วันที่ 22 เมษายน — ห้องปฏิบัติการวิจัยด้าน AI NeoCognition ประกาศเสร็จสิ้นการระดมทุนรอบเมล็ดพันธุ์ $40 ล้านดอลลาร์ โดยออกจากโหมดซ่อนตัว ก่อตั้งโดยรองศาสตราจารย์ Yu Su จากมหาวิทยาลัย Ohio State University ร่วมกับ Xiang Deng และ Yu Gu บริษัทมีสำนักงานใหญ่ที่เมือง Palo Alto รัฐแคลิฟอร์เนีย เงินรอบนี้

GateNews25 นาที ที่แล้ว

PicWe เปิดตัวกระเป๋าเงิน AI Agent พร้อมการจัดการคีย์บนอุปกรณ์

PicWe ประกาศเปิดตัวเบตาสาธารณะของ PicWe Wallet กระเป๋าเงินคีย์แบบออนดีไวซ์ที่ขับเคลื่อนด้วยเอเจนต์ AI พร้อมไม่มีวลีสำหรับกู้คืน รองรับสินทรัพย์หลายเชน สวอป การทำงานอัตโนมัติที่เข้าถึงด้วย AI และมุ่งหมายที่จะรวมโครงสร้างพื้นฐานด้าน RWA เข้าด้วยกัน PicWe ได้เปิดตัวเบตาสาธารณะของ PicWe Wallet ซึ่งเป็นกระเป๋าเงินที่รองรับ AI Agent เก็บคีย์ไว้บนอุปกรณ์โดยตรง ตัดความจำเป็นของวลีสำหรับกู้คืน และทำให้การทำงานที่สำคัญยังคงอยู่ในเครื่อง กระบวนการเบตานี้รองรับการจัดการสินทรัพย์หลายเชน การสวอป และค่าธรรมเนียมที่ใช้เหรียญสเตเบิลโคอิน พร้อมทั้งเปิดใช้งานการโต้ตอบกับ AI แบบตั้งโปรแกรมได้ ความคิดริเริ่มที่กว้างขึ้นของ PicWe วางตำแหน่งแพลตฟอร์มให้เป็นโครงสร้างพื้นฐานแบบรวมสำหรับสินทรัพย์ในโลกจริง โดยรองรับการออกโทเค็น การหมุนเวียน การชำระบัญชี การชำระเงินข้ามพรมแดน การทำโทเคไนเซชัน และการประสานงานในห่วงโซ่อุปทานสำหรับกรณีการใช้งานระดับองค์กร

GateNews1 ชั่วโมง ที่แล้ว

Hugging Face ปล่อยโค้ดโอเพนซอร์ส ml-intern ซึ่งเป็นตัวแทน AI สำหรับการวิจัย ML แบบอิสระ

ปล่อยโค้ดโอเพนซอร์ส ml-intern ตัวแทนวิจัย ML แบบอิสระของ Hugging Face ที่อ่านเอกสาร คัดสรรข้อมูล ฝึก ประเมิน และปรับปรุงอย่างต่อเนื่องข้ามสาขาวิทยาศาสตร์ แพทยศาสตร์ และคณิตศาสตร์. บทคัดย่อ: ml-intern ของ Hugging Face เป็นตัวแทนวิจัย ML แบบอิสระโอเพนซอร์สที่อ่านเอกสาร คัดสรรชุดข้อมูล ฝึกบน GPU ในเครื่องหรือบนคลาวด์ ประเมินผลลัพธ์ และวนลูปเพื่อปรับปรุง Built บน smolagents พร้อมทั้งอินเทอร์เฟซแบบ CLI และแบบเว็บ มันนำทางผ่าน arXiv/HF Papers, HF Hub และ HF Jobs การเดโมครอบคลุมตั้งแต่วิทยาศาสตร์ แพทยศาสตร์ ไปจนถึงคณิตศาสตร์ แสดงให้เห็นระบบอัตโนมัติแบบ end-to-end และการเพิ่มสมรรถนะ.

GateNews1 ชั่วโมง ที่แล้ว

อาจารย์จาก Tsinghua ไต้ จี้เฟิง เปิดตัว Naive.ai และระดมทุน ~$300M ที่มูลค่า $800M

ข่าวประตูเมือง วันที่ 22 เมษายน — ไต้ จี้เฟิง อาจารย์ประจำคณะวิศวกรรมอิเล็กทรอนิกส์แห่งมหาวิทยาลัย Tsinghua ได้ก่อตั้ง Naive.ai ซึ่งเป็นบริษัทที่มุ่งเน้นการฝึกหลังโมเดลแบบโอเพนซอร์สและเอเจนต์ด้าน AI สตาร์ทอัพดังกล่าวระดมทุนได้ราว $300 ล้านดอลลาร์ โดยประเมินมูลค่าอยู่ที่ประมาณ $80

GateNews2 ชั่วโมง ที่แล้ว

AWS ขยายเวิร์กโฟลว์ AI แบบหลายเอเจนต์ รองรับ Claude Opus 4.7 บน Bedrock

ข่าว Gate News วันที่ 22 เมษายน — Amazon Web Services ประกาศขยายความริเริ่ม AI เชิงเอเจนต์ผ่านเวิร์กโฟลว์แบบหลายเอเจนต์ โดยรองรับ Anthropic's Claude Opus 4.7 บน Amazon Bedrock เพื่อช่วยให้ลูกค้าก้าวพ้นจากการทดลองนำร่องด้าน generative AI บริษัทกำลังขยายความสัมพันธ์กับพาร์ทเนอร์ ขณะที่ลูกค้าปรับเปลี่ยนจากเครื่องมือ AI เดี่ยวไปสู่ระบบที่เชื่อมต่อเอเจนต์เฉพาะทางหลายตัว ซึ่งลูกค้า

GateNews2 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น