Alibaba เปิดตัวโมเดลเอเจนต์โอเพนซอร์ส AgenticQwen: เวอร์ชัน 8B เข้าใกล้ประสิทธิภาพ 235B ด้วย Dual Data Flywheels

GateNews

ข่าวประจำเกต วันที่ 27 เมษายน — ทีม PAI ของ Alibaba ได้เผยแพร่และเปิดซอร์ส AgenticQwen ซึ่งเป็นโมเดลภาษาระดับเอเจนต์ขนาดเล็ก ออกแบบมาสำหรับงานประยุกต์เรียกใช้เครื่องมือระดับอุตสาหกรรม โมเดลนี้มีให้เลือก 2 เวอร์ชัน ได้แก่ 8B และ 30B-A3B ได้รับการฝึกผ่านกรอบการเรียนรู้แบบเสริมแรง “dual data flywheel” ที่เป็นนวัตกรรม AgenticQwen บรรลุความสามารถระดับเอเจนต์ที่เทียบใกล้กับโมเดลระดับเกือบหนึ่งล้านล้านพารามิเตอร์ ขณะเดียวกันลดต้นทุนการอินเฟอเรนซ์ได้อย่างมีนัยสำคัญ

กลไก dual data flywheel แก้ปัญหาการทำข้อมูลสังเคราะห์ให้มีลักษณะเหมือนกันเกินไปในข้อมูลสังเคราะห์แบบดั้งเดิม reasoning flywheel จะสร้างตัวแปรที่ยากขึ้นโดยอัตโนมัติจากข้อผิดพลาดของโมเดล ในขณะที่ agentic flywheel จะขยายเวิร์กโฟลว์เชิงเส้นอย่างง่าย (เช่น กระบวนการจองตั๋ว)ให้กลายเป็นพฤติกรรมแบบ multi-branch behavior trees พร้อมข้อจำกัด การปฏิเสธ และเงื่อนไขเชิงปฏิปักษ์ จำลองสถานการณ์การตัดสินใจที่ซับซ้อนในโลกความเป็นจริง ผลการทดสอบชี้ว่า AgenticQwen-8B ทำคะแนนได้ 47.4 บนเกณฑ์วัดสภาพแวดล้อมเครื่องมือจริง (TAU-2 และ BFCL-V4) ซึ่งสูงกว่าพื้นฐาน Qwen3-8B (23.8) อย่างมาก และเข้าใกล้ Qwen3-235B (52.0) AgenticQwen-30B-A3B (โดยมีเพียง 3B พารามิเตอร์ที่ถูกเปิดใช้งาน) ทำคะแนนได้ 50.2.

โมเดลนี้ถูกนำไปใช้งานในระบบการผลิตภายในที่คล้ายกับ Manus ทำให้ช่องว่างกับโมเดล 235B ในด้านเวลาอินเฟอเรนซ์แบบ end-to-end แคบลงอย่างมาก อย่างไรก็ตาม โมเดลถูกจำกัดด้วยความยาวบริบทดั้งเดิม 40K โทเค็น ซึ่งส่งผลให้ประสิทธิภาพของมันลดลงในงาน deep search

news.article.disclaimer

btc.bar.articles

AI Agents ขับเคลื่อนความต้องการการชำระเงินด้วยคริปโต, x402 ประมวลผล 165M ธุรกรรม

ข้อความ Gate News ประจำวันที่ 27 เมษายน — เจสซี่ โพลลัค (Jesse Pollak) ผู้บริหารของ CEX รายใหญ่ ได้โต้แย้งว่าเอเจนต์ AI แบบอัตโนมัติกำลังสร้าง “ศูนย์กลางความต้องการ” แห่งใหม่สำหรับการชำระเงินด้วยคริปโต ซึ่งต้องใช้โครงสร้างพื้นฐานการชำระเงินที่รองรับแบบเนทีฟสำหรับซอฟต์แวร์ เมื่อวันที่ 20 เมษายน มีการประกาศว่า อีโคซิสเต็ม x402 ได้ประมวลผลธุรกรรมมากกว่า 165

GateNews1 ชั่วโมง ที่แล้ว

เอเจนต์ Cursor AI ทำงานพลาด! โค้ดบรรทัดเดียวล้างข้อมูลฐานข้อมูลของบริษัทภายใน 9 วินาที การรักษาความปลอดภัยกลายเป็นแค่คำพูดลอยๆ

ผู้ก่อตั้ง PocketOS อย่าง Jer Crane ระบุว่า Cursor AI agent ได้ดำเนินการบำรุงรักษาโดยตัวมันเองในสภาพแวดล้อมทดสอบ ใช้ประโยชน์จาก token ของ API ที่เพิ่ม/ลบโดเมนที่กำหนดเองอย่างไม่เหมาะสม เพื่อส่งคำสั่งลบไปยัง Railway's GraphQL API ภายใน 9 วินาที ข้อมูลและสแนปช็อตในโซนเดียวกันถูกทำลายทั้งหมด โดยล่าสุดสามารถกู้คืนได้ถึงสามเดือนก่อนเท่านั้น เอเจนต์ยอมรับว่ามีการละเมิดข้อกำหนดสำหรับการดำเนินการที่ไม่สามารถย้อนกลับได้ ไม่ได้อ่านเอกสารทางเทคนิค และไม่ได้ตรวจสอบการแยกสภาพแวดล้อม ผู้เสียหายคือกลุ่มลูกค้าธุรกิจให้เช่ารถ การจองและข้อมูลทั้งหมดหายไป และต้องใช้เวลานานสำหรับวิศวกรรมการปรับยอด Crane เสนอการปฏิรูป 5 ข้อ: การยืนยันด้วยมือ สิทธิ API แบบละเอียด แยกการสำรองข้อมูลกับข้อมูลหลัก เผยแพร่ SLA และกลไกบังคับในระดับพื้นฐาน

ChainNewsAbmedia1 ชั่วโมง ที่แล้ว

DeepSeek V4 Pro บน Ollama Cloud: เชื่อมต่อ Claude Code แบบกดครั้งเดียว

ตามทวีตของ Ollama DeepSeek V4 Pro เปิดตัวเมื่อ 4/24 ได้ถูกเพิ่มเข้าไปในไดเรกทอรีของ Ollama ในโหมดคลาวด์ และสามารถเรียกใช้เครื่องมือต่างๆ เช่น Claude Code, Hermes, OpenClaw, OpenCode, Codex ฯลฯ ได้ด้วยคำสั่งเดียวเท่านั้น V4 Pro1.6T พารามิเตอร์, context 1M, Mixture-of-Experts; การอนุมานบนคลาวด์ไม่ดาวน์โหลดน้ำหนัก (weights) ลงในเครื่อง หากต้องการใช้งานแบบโลคอลให้ดาวน์โหลด weights ด้วยตนเอง และรันด้วย INT4/GGUF และ GPU หลายการ์ด การทดสอบความเร็วในช่วงแรกได้รับผลกระทบจากภาระงานของคลาวด์ โดยค่าปกติอยู่ที่ประมาณ 30 tok/s และค่าสูงสุด 1.1tok/s; แนะนำให้ใช้ต้นแบบบนคลาวด์ เมื่อเข้าสู่การผลิตจำนวนมากแล้วค่อยทำการอนุมานด้วยตนเองหรือใช้ API เชิงพาณิชย์

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

UB(Unibase)24小时上涨14.96%

Gate News 消息,4 月 27 日,据 Gate 行情显示,截至发稿时,UB(Unibase)现报 0.0491 美元,24 小时内上涨 14.96%,最高触及 0.0534 美元,最低回落至 0.0423 美元,24 小时交易量达 396.67 万美元。当前市值约为 1.23 亿美元。 Unibase 是一个高性能去中心化 AI 记忆层,为 AI 代理提供长期记忆和跨平台互操作性,使其能够记忆、协作和自我进化。Unibase 旨在构建开放代理互联网,支持智能代理在生态系统间无缝协作,赋能开发者构建下一代 AI 应用。 此消息不作为投资建议,投资需注意市场波动风险。

GateNews2 ชั่วโมง ที่แล้ว

กัวหมิงฉี: OpenAI จะทำ AI Agent บนมือถือ โดย MediaTek, Qualcomm และ Luxshare Precision เป็นห่วงโซ่อุปทานที่สำคัญ

กู่หมิงเฉิงกล่าวอ้างว่า OpenAI กำลังร่วมมือกับ MediaTek, Qualcomm และ Luxshare Precision เพื่อพัฒนา AI Agent มือถือ โดยคาดว่าจะเริ่มการผลิตจำนวนมากในปี 2028 มือถือเครื่องใหม่จะยึดหลักการทำภารกิจให้สำเร็จเป็นแกน โดย AI เอเจนต์จะเข้าใจและดำเนินการตามความต้องการ ผสานพลังการประมวลผลทั้งฝั่งคลาวด์และฝั่งอุปกรณ์ โดยเน้นที่การรับรู้จากเซนเซอร์และความเข้าใจบริบท รายการสเปกและรายชื่อซัพพลายเชนคาดว่าจะได้รับการสรุปในช่วงปี 2026–2027 หากแผนดังกล่าวเป็นรูปเป็นร่าง อาจสร้างรอบการเปลี่ยนเครื่องใหม่สำหรับตลาดระดับสูง และ Luxshare มีแนวโน้มที่จะเป็นผู้ได้รับประโยชน์หลัก

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

ผู้รับผิดชอบโมเดลขนาดใหญ่ของ Xiaomi: การแข่งขันด้าน AI กำลังเข้าสู่ยุคของ Agent และการพัฒนาตัวเองคือเหตุการณ์สำคัญสู่ AGI

หัวหน้าทีมโมเดลขนาดใหญ่ของ Xiaomi คุณ Luo Fuli ให้สัมภาษณ์เชิงลึกบนแพลตฟอร์ม Bilibili เมื่อวันที่ 24 เมษายน (หมายเลขวิดีโอ: BV1iVoVBgERD) โดยมีความยาวในการสัมภาษณ์ 3.5 ชั่วโมง และถือเป็นครั้งแรกที่เธอในฐานะผู้รับผิดชอบด้านเทคโนโลยีได้อธิบายมุมมองทางเทคนิคอย่างเป็นระบบต่อสาธารณะ Luo Fuli กล่าวว่า การแข่งขันในสายงานโมเดลขนาดใหญ่ได้เปลี่ยนจากยุคของ Chat ไปสู่ยุคของ Agent แล้ว และชี้ว่า “การวิวัฒนาการด้วยตนเอง” จะเป็นเหตุการณ์สำคัญของ AGI ในปีหน้า

MarketWhisper3 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น