News | Gate.com

支付方式为

USD

支持 Visa、Mastercard、SEPA 等多种支付方式

灵活买卖币，0 手续费

加密货币支付卡全球支付无忧

法币投资获得资金增值

基础交易

自由交易数字货币

借币交易，放大收益

闪兑与定投

大小额通兑、0 费率、无滑点

自动调仓无惧强平，自带杠杆放大收益

提前交易，先发制人

进阶交易

使用 Gate 钱包进行链上交易

链上掘金，智选新币

交易机器人

智能策略，自动交易

跟随专家实现收益增长

一份保证金，跨平台共用

数百种永续合约市场

一站交易全球传统资产

欧式 T 型报价，丰富的到期日和行权价

实现最大化资金效率

从零开始掌握合约交易技巧

参与活动赢取奖励

使用模拟资金无风险体验真实交易

打新

参与活动赚糖果，赢超值空投奖励

一键质押，赚取潜力新币

持有 GT，免费领取海量空投

打新自由，直通全球股票发行市场

交易链上资产，享空投福利

合约交易得积分，空投奖励待领取

理财产品

闲置代币，随时赚取收益

定期定额，让理财变得更简单

低买高卖，波动获益

通过灵活质押资产获取收益

抵押资产，即时借币

一站式借贷入口

VIP 专享理财

尊享理财定制助力财富增值

私人财富管理

臻享定制财富方案

顶尖量化，稳健护航

链上精选，质押赚币

到期前不强平，安心持币享杠杆收益

铸造 GUSD，享国债 RWA 收益

分享动态发现价值

每日行情分析直播

随时随地与币友实时交流

一站式获取最新行业资讯

更多

"SFT"的搜索结果

2026-04-23

04:54

Perplexity 公开网页搜索代理的后训练方法；基于 Qwen3.5 的模型在准确率与成本上胜过 GPT-5.4

AI 行业动态

Perplexity 使用 Qwen3.5 模型进行先 SFT 后 RL 的训练流程，借助多跳 QA 数据集和评分规则检查来提升搜索的准确性与效率，实现同类最佳的 FRAMES 表现。摘要：Perplexity 面向网页搜索代理的后训练工作流将使用监督微调 (SFT) 来强化指令遵循与语言一致性，并通过 GRPO 算法结合在线强化学习 (RL)。强化学习阶段使用专有的多跳可验证 QA 数据集以及基于评分规则的对话数据，以防止 SFT 漂移，并采用奖励门控与组内效率惩罚。评估显示，Qwen3.5-397B-SFT-RL 在 FRAMES 上取得顶级表现：单次工具调用准确率为 57.3%，四次调用为 73.9%，成本为每次查询 $0.02，且在这些指标上优于 GPT-5.4 和 Claude Sonnet 4.6。定价基于 API，并且不包括缓存。

展开

05:38

Prime Intellect 推出 INTELLECT-3 模型

去中心化 AI 协议 Prime Intellect 推出具有 106B 参数的混合专家模型 INTELLECT-3，该模型基于 GLM 4.5 Air Base 模型，并采用 SFT 和 RL 进行训练。Prime Intellect 在今年 3 月完成 1500 万美元融资。

展开