Hugging Face 开源 ml-intern:面向自主 ML 研究的 AI 代理

Gate News 消息,4 月 22 日——Hugging Face 已开源 ml-intern,这是一款 ML 研究代理,能够自主完成完整工作流:阅读论文、整理数据集、启动 GPU 训练、评估结果,并迭代改进。该项目基于 Hugging Face 的 smolagents 框架,提供 CLI 和基于网页的界面,代码可在 GitHub 上获取。

ml-intern 工具链围绕 Hugging Face 生态系统设计。它会从 arXiv 和 HF Papers 获取论文,同时追踪引文链以便进行更深入阅读;在 HF Hub 上浏览数据集、验证质量,并对数据进行重格式化以用于训练;当本地 GPU 资源不可用时,会调用 HF Jobs 来启动基于云的训练任务。训练完成后,代理会自动读取评估输出、诊断失败原因,并重新运行实验。默认情况下,它使用 Claude Sonnet 4.5 来驱动决策循环,每次运行最多 300 次迭代,并在超过 170k tokens 时自动进行上下文压缩。

Hugging Face 展示了三个用例。在科学推理任务中,代理通过引文链识别出 OpenScience 和 NemoTron-CrossThink 数据集;按难度级别从 ARC、SciQ 和 MMLU 中筛选出 7 个变体;并在 Qwen3-1.7B 上进行了 12 轮有监督微调,使 GPQA 分数在不到 10 小时内从 10% 提升到 32%。在医疗应用中,代理判断现有数据集不足,编写脚本生成 1,100 个合成数据样本,并将其扩展 50 倍用于训练;其在 HealthBench 上的表现比 Codex 高出 60%。在竞争性的数学场景中,代理编写了一个 GRPO 训练脚本,并通过 HF Spaces 在 A100 GPU 上启动训练;随后在观察到奖励崩塌后进行了消融研究。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

مايكروسوفت تكشف عن بنية تجارة وكلاء الذكاء الاصطناعي: سوق للناشرين وبروتوكولات للتجار وأدوات إعلانية

رسالة Gate News، 22 أبريل — أعلن تيم فرانك، نائب رئيس تحقيقات/تحصيل الإيرادات بالذكاء الاصطناعي لدى مايكروسوفت، عن مجموعة من تحديثات البنية التحتية التجارية المصممة لعصر "الويب الوكيل"، بما يتيح للناشرين والتجار والمعلنين البقاء قابلين للاكتشاف والتداول بينما يتخذ وكلاء الذكاء الاصطناعي قرارات الشراء نيابةً عن المستخدمين في

GateNewsمنذ 27 د

NeoCognition تجمع $40M في تمويل بذري لوكلاء ذكاء اصطناعي للتعلم أثناء العمل

بوابة أخبار: رسالة 22 أبريل — أعلنت شركة مختبر أبحاث الذكاء الاصطناعي NeoCognition عن إتمام جولة تمويل بذري بقيمة $40 مليون دولار، والخروج من وضع التخفي. تأسست على يد أستاذ مشارك في جامعة ولاية أوهايو يو سو، إلى جانب شيانغ دينغ ويو غِو، ويقع مقر الشركة في بالو ألتو، كاليفورنيا. الجولة تم

GateNewsمنذ 44 د

PicWe 推出具备设备端密钥管理的 AI 代理钱包

PicWe 宣布 PicWe 钱包的公开测试版,该钱包是一种由 AI 代理赋能、支持离线设备端密钥管理的钱包,并且无需恢复短语。它支持多链资产、兑换、AI 可访问的自动化,并旨在统一 RWA 基础设施。 PicWe 已推出 PicWe 钱包的公开测试版:这是一款由 AI 代理赋能的钱包,会将密钥存储在设备端,消除恢复短语,并使关键操作保持在本地。测试版支持多链资产管理、兑换,以及基于稳定币的费用,同时支持可编程的 AI 交互。更广泛的 PicWe 计划将该平台定位为面向真实世界资产的统一基础设施,使其能够用于发行、流通、结算、跨境支付、代币化以及企业用例的供应链协同。

GateNewsمنذ 1 س

Google Research تطلق ReasoningBank: وكلاء الذكاء الاصطناعي يتعلمون استراتيجيات الاستدلال من النجاح والفشل

رسالة أخبار البوابة، 22 أبريل — أطلقت Google Research ReasoningBank، وهو إطار عمل لِـذاكرة الوكلاء يتيح لوكلاء مدفوعين بنماذج لغوية كبيرة التعلّم بشكل مستمر بعد النشر. يستخرج الإطار استراتيجيات استدلال عامة من تجارب المهام الناجحة والفاشلة على حد سواء، ويخزنها في

GateNewsمنذ 2 س

清华教授戴继锋推出 Naive.ai,融资约 $300M ,估值 $800M

Gate News 消息,4月22日——清华大学电子工程系副教授戴继锋创立了 Naive.ai,这是一家专注于开源模型后训练和 AI 代理的公司。该初创公司已融资约 $300 百万,估值约为 80

GateNewsمنذ 2 س

AWS توسّع سير عمل الذكاء الاصطناعي متعدد العوامل، وتدعم Claude Opus 4.7 على Bedrock

رسالة Gate News في 22 أبريل — أعلنت شركة Amazon Web Services عن توسيع مبادراتها الخاصة بالذكاء الاصطناعي الوكيل من خلال سير عمل متعدد العوامل، مع دعم Anthropic's Claude Opus 4.7 على Amazon Bedrock لمساعدة العملاء على تجاوز تجارب الطيار الخاصة بالذكاء الاصطناعي التوليدي. وتقوم الشركة بتوسيع علاقاتها مع الشركاء بينما ينتقل العملاء من أدوات ذكاء اصطناعي مفردة إلى أنظمة تربط بين عدة وكلاء متخصصين،

GateNewsمنذ 3 س
تعليق
0/400
لا توجد تعليقات