Gate News 消息,4 月 22 日——Hugging Face 已开源 ml-intern,这是一款机器学习研究代理,能够自主完成完整工作流:阅读论文、整理数据集、启动 GPU 训练、评估结果并迭代改进。该项目基于 Hugging Face 的 smolagents 框架,提供 CLI 和基于网页的界面,代码可在 GitHub 上获取。
ml-intern 工具链围绕 Hugging Face 生态系统设计。它从 arXiv 和 HF Papers 检索论文,同时追踪引文链以便更深入阅读;在 HF Hub 上浏览数据集,验证质量,并将数据重新格式化以用于训练;当本地 GPU 资源不可用时,它会调用 HF Jobs 来启动基于云端的训练任务。训练完成后,代理会自动读取评估输出、诊断失败原因,并重新运行实验。默认情况下,它使用 Claude Sonnet 4.5 来驱动决策循环,每次运行最多 300 次迭代,并在超过 170k tokens 时自动进行上下文压缩。
Hugging Face 展示了三个使用案例。在科学推理任务中,代理通过引文链识别出 OpenScience 和 NemoTron-CrossThink 数据集;按难度等级从 ARC、SciQ 和 MMLU 中筛选出 7 个变体;并在 Qwen3-1.7B 上进行了 12 轮监督微调,使 GPQA 分数在 10 小时内从 10% 提升到 32%。在医疗应用中,代理判断现有数据集不足,编写脚本生成 1,100 个合成数据样本,并将其放大 50 倍用于训练,在 HealthBench 上相较 Codex 的表现提升了 60%。在竞争性的数学场景中,代理编写了一个 GRPO 训练脚本,并通过 HF Spaces 在 A100 GPU 上启动训练;随后在观察到奖励崩塌后开展了消融实验。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
微软发布 AI 代理商务基础设施:出版商市场、商户协议和广告工具
Gate News 消息,4月22日——微软的 AI 变现副总裁 Tim Frank 宣布了一系列面向“agentic web”时代的商业基础设施更新,旨在让出版商、商户和广告主在 AI 代理代表用户做出采购决策时,依然能够被发现并进行交易,
GateNews27 分钟前
NeoCognition 融资 $40M 用于在岗学习 AI 代理的种子轮
Gate 新闻消息,4月22日——人工智能研究实验室 NeoCognition 宣布完成了一笔 $40 百万美元的种子轮融资,脱离隐身模式。该公司由俄亥俄州立大学副教授 Yu Su 以及 Xiang Deng 和 Yu Gu 创立,总部位于美国加利福尼亚州帕洛阿尔托。该轮融资……
GateNews44 分钟前
PicWe Launches AI Agent Wallet with On-Device Key Management
PicWe announces public beta of PicWe Wallet, an AI-agent-enabled, on-device key wallet with no recovery phrases. It supports multi-chain assets, swaps, AI-accessible automation, and aims to unify RWA infrastructure.
PicWe has launched the public beta of PicWe Wallet, an AI Agent-enabled wallet that stores keys on-device, eliminates recovery phrases, and keeps critical operations local. The beta supports multi-chain asset management, swaps, and stablecoin-based fees while enabling programmable AI interactions. Broader PicWe initiatives position the platform as unified infrastructure for real-world assets, enabling issuance, circulation, settlement, cross-border payments, tokenization, and supply-chain coordination for enterprise use cases.
GateNews1小时前
谷歌研究发布 ReasoningBank:AI 智能体从成功与失败中学习推理策略
Gate 新闻消息,4月22日——谷歌研究发布了 ReasoningBank,这是一个智能体记忆框架,使基于大型语言模型的智能体能够在部署后持续学习。该框架从成功和失败的任务经验中提取通用推理策略,并将其
GateNews2小时前
清华教授戴济峰推出Naive.ai,融资约$300M ,估值$800M
Gate 新闻消息,4月22日——清华大学电子工程系副教授戴济峰创立了Naive.ai,该公司专注于开源模型的后训练以及AI代理。该初创公司已筹集约$300 百万,预计估值为$80
GateNews2小时前
AWS 扩展多智能体 AI 工作流,并支持在 Bedrock 上使用 Claude Opus 4.7
Gate News 消息,4月22日——亚马逊网络服务宣布通过多智能体工作流扩展其代理式 AI 计划,支持在 Amazon Bedrock 上使用 Anthropic 的 Claude Opus 4.7,帮助客户超越生成式 AI 试点。该公司正在扩大合作伙伴关系,因为客户正从单一 AI 工具转向将多个专门化智能体连接起来的系统。
GateNews3小时前