阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本借助双数据飞轮接近 235B 的性能

GateNews

快讯信息,4月27日——阿里巴巴 PAI 团队发布并开源了 AgenticQwen,这是一款为工业级工具调用应用打造的小规模智能体语言模型。该模型提供两个版本:8B 和 30B-A3B。通过一种创新的“双数据飞轮”强化学习框架进行训练,AgenticQwen 在显著降低推理成本的同时,实现了接近万亿参数级别的模型层面智能体能力。

“双数据飞轮”机制解决了传统合成数据中同质化的问题。推理飞轮会从模型错误中自动生成更难的变体,而智能体飞轮则将诸如单次预订流程(等简单线性工作流)扩展为带约束、拒绝与对抗条件的多分支行为树,从而模拟真实世界中复杂的决策场景。基准测试显示,AgenticQwen-8B 在真实工具环境基准(TAU-2 和 BFCL-V4)上的得分为 47.4,远超基础 Qwen3-8B (23.8),并接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (仅激活 3B 个参数) 达到 50.2。

该模型已部署到类似 Manus 的内部生产系统中,端到端推理时间方面与 235B 模型的差距显著缩小。不过,模型的原生上下文长度为 40K tokens,这限制了其在深度搜索任务中的表现。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

AI 代理推动加密支付需求,x402 处理 1.65 亿笔交易

Gate 新闻消息,4月27日——大型 CEX 的高管 Jesse Pollak 认为,自治 AI 代理正在为加密货币支付创造一个新的“需求中心”,从而需要软件原生的支付基础设施。4月20日,据宣布 x402 生态系统已处理超过 165

GateNewsمنذ 1 س

تمت فضيحة وكيل Cursor AI! سطر واحد من التعليمات البرمجية يفرّغ قاعدة بيانات الشركة خلال 9 ثوانٍ، وتحوّلت الضمانات الأمنية إلى كلام فارغ

مؤسس PocketOS Jer Crane 指اعتمد وكيل Cursor AI في بيئة اختبارية لتنفيذ صيانة من تلقاء نفسه، وأساء استخدام رمز API مخصص لإضافة/إزالة نطاقات مخصصة، وأطلق أمر حذف ضد واجهة Railway GraphQL API. خلال 9 ثوانٍ تم تدمير البيانات وجميع لقطات النسخ الاحتياطي في نفس المنطقة بالكامل، وكان آخر شيء يمكن استعادته هو من ثلاث أشهر سابقة. اعترف الوكيل بانتهاك قواعد العمليات غير القابلة للإرجاع، وعدم الاطلاع على الوثائق التقنية، وعدم التحقق من عزل البيئة وغيرها من المتطلبات؛ وكانت الضحية هي عملاء قطاع تأجير السيارات، حيث اختفت الحجوزات والبيانات بالكامل، واستغرق عمل الموازنة مع الحسابات الهندسية وقتًا طويلًا. قدم Crane خمس إصلاحات: تأكيد يدوي، صلاحيات API دقيقة الحبيبات، فصل النسخ الاحتياطية عن البيانات الرئيسية، نشر SLA، وآليات إلزامية على مستوى البنية التحتية.

ChainNewsAbmediaمنذ 1 س

DeepSeek V4 Pro على Ollama Cloud: اتصال بنقرة واحدة لـ Claude Code

وفقًا لتغريدة من Ollama، تم إصدار DeepSeek V4 Pro في 4/24، وقد تم إدراجه في دليل Ollama بنمط السحابة (Cloud)؛ ويمكن استدعاء أدوات مثل Claude Code وHermes وOpenClaw وOpenCode وCodex وغيرها بأمر واحد فقط. تضم V4 Pro 1.6T参数 و1M context، مع Mixture-of-Experts؛ لا يقوم الاستدلال عبر السحابة بتنزيل الأوزان على الجهاز المحلي. إذا كنت تريد تشغيله محليًا، فستحتاج إلى جلب الأوزان بنفسك وتنفيذه باستخدام INT4/GGUF وبوحدات GPU متعددة. تأثرت اختبارات الأداء المبكرة بحِمل الخادم السحابي؛ فمعدل الوضع الطبيعي حوالي 30 tok/s، بينما القمة 1.1 tok/s. يُنصح باستخدام النموذج عبر السحابة (prototype)؛ وعند بدء الإنتاج الرسمي يمكنك إجراء الاستدلال بنفسك أو استخدام واجهة برمجة تطبيقات تجارية.

ChainNewsAbmediaمنذ 2 س

ارتفاع UB (Unibase) بنسبة 14.96% خلال 24 ساعة

بوابة الأخبار: وفقًا لخبرية Gate في 27 أبريل، تظهر بيانات Gate أن UB (Unibase) يتم تداوله حاليًا عند 0.0491 دولار، حتى وقت إعداد هذا التقرير. ارتفع بنسبة 14.96% خلال 24 ساعة، وبلغ أعلى مستوى له 0.0534 دولار، وانخفض إلى أدنى مستوى عند 0.0423 دولار. وبلغ حجم التداول خلال 24 ساعة 396.67 مليون دولار. القيمة السوقية الحالية تقارب 1.23 مليون دولار. Unibase هي طبقة ذاكرة لذكاء اصطناعي لامركزية عالية الأداء، توفر لوكلاء الذكاء الاصطناعي ذاكرة طويلة المدى وتوافقًا بين المنصات، مما يمكّنهم من التذكر والتعاون والتطور الذاتي. تهدف Unibase إلى بناء إنترنت مفتوح للوكلاء، ودعم التعاون السلس بين الوكلاء الأذكياء عبر الأنظمة البيئية، وتمكين المطورين من إنشاء تطبيقات الذكاء الاصطناعي من الجيل التالي. لا تُعد هذه الرسالة نصيحة استثمارية، ويجب الانتباه إلى مخاطر تقلبات السوق عند الاستثمار.

GateNewsمنذ 2 س

郭明錤: يجب أن تقوم OpenAI ببناء هاتف محمول يعمل بوكلاء الذكاء الاصطناعي، وتُعد MediaTek وQualcomm وLuxshare Technologies سلاسل التوريد الرئيسية

郭明錤 يزعم أن OpenAI تعمل بالتعاون مع MediaTek وQualcomm وLuxshare Precision لتطوير هاتف يعمل بوكلاء ذكاء اصطناعي (AI Agent)، مع توقع بدء الإنتاج الضخم في عام 2028. سيعتمد الهاتف الجديد على إنجاز المهام كجوهر، حيث يفهم الوكيل الذكي المتطلبات وينفذها، مع دمج الحوسبة على السحابة وعلى الجهاز، مع التركيز على الاستشعار وفهم السياق. من المتوقع أن يتم حسم قائمة المواصفات وسلسلة التوريد في الفترة 2026–2027، وإذا تحقق ذلك، فقد يؤدي إلى دورة ترقية جديدة للهواتف في سوق الفئة الراقية، ومن الممكن أن تصبح Luxshare هي المستفيد الرئيسي.

ChainNewsAbmediaمنذ 2 س

مدير مسؤول نموذج مايكروسوفت الكبير لدى Xiaomi: تتجه المنافسة في مجال الذكاء الاصطناعي إلى عصر الوكلاء (Agent)، ويُعدّ التطور الذاتي حدثًا محوريًا نحو الذكاء الاصطناعي العام (AGI)

يتولى رئيس فريق نماذج Xiaomi الكبيرة، لوو فولي، في 24 أبريل إجراء مقابلة معمقة على منصة بيليبيلي (رقم الفيديو: BV1iVoVBgERD)، لمدة 3.5 ساعة، وهي أول مرة تقدم فيها بشكل علني ومنهجي وجهات نظرها التقنية بصفة مسؤولة تقنية. تقول لوو فولي إن مسار المنافسة على نماذج الذكاء الكبير قد انتقل من عصر المحادثة (Chat) إلى عصر الوكلاء (Agent)، مشيرة إلى أن «التطور الذاتي» سيكون الحدث الحاسم للذكاء الاصطناعي العام (AGI) خلال العام القادم.

MarketWhisperمنذ 3 س
تعليق
0/400
لا توجد تعليقات