News | Gate.com

付款方式為

USD

支援 Visa、Mastercard、SEPA 等多種支付方式

靈活買賣幣，0手續費

加密貨幣付款卡全球付款無憂

基礎交易

自由交易數字貨幣

借幣交易，放大收益

閃兌與定投

大小額通兌、0 費率、無滑點

自動調倉無懼強平，自帶槓桿放大收益

提前交易，先發制人

進階交易

使用 Gate 錢包進行鏈上交易

鏈上掘金，智選新幣

交易機器人

智能策略，自動交易

跟隨專家實現收益增長

一份保證金，跨平台共用

數百種永續合約市場

一站交易全球傳統資產

歐式 T 型報價，豐富的到期日和行權價

實現最大化資金效率

從零開始掌握合約交易技巧

參與活動贏取獎勵

使用模擬資金無風險體驗真實交易

打新

參與活動賺糖果，贏超值空投獎勵

一鍵質押，賺取潛力新幣

持有 GT，免費領取海量空投

打新自由，直通全球股票發行市場

交易鏈上資產，享空投福利

合約交易得積分，空投獎勵待領取

理財產品

閒置代幣，隨時賺取收益

定期定額，讓理財變得更簡單

低買高賣，波動獲益

通過靈活質押資產獲取收益

抵押資產，即時借幣

一站式借貸入口

VIP 專屬理財

尊享理財訂製助力財富增值

私人財富管理

臻享訂製財富方案

頂尖量化，穩健護航

鏈上精選，質押賺幣

到期前不強平，安心持幣享槓桿收益

鑄造 GUSD，享國債 RWA 收益

分享動態發現價值

每日行情分析直播

隨時隨地與幣友即時交流

一站式獲取最新行業資訊

更多

"SFT"的搜尋結果

2026-04-23

04:54

Perplexity 揭露 Web 搜尋代理後訓練方法；基於 Qwen3.5 的模型在準確率與成本上超越 GPT-5.4

AI 行業動態

Perplexity 使用搭配 Qwen3.5 模型的 SFT，並在其後使用帶有 RL 的強化學習；透過多跳 QA 資料集與規則量表檢查來提升搜尋的準確性與效率，實現業界一流的 FRAMES 表現。摘要：Perplexity 的線上搜尋代理後訓練流程，結合監督式微調 (SFT)，以透過線上強化學習 (RL)（使用 GRPO 演算法）來強制遵循指令與語言一致性。RL 階段使用專有的多跳可驗證問答資料集，以及基於規則量表的對話資料，以防止 SFT 漂移，並採用獎勵閘控與同組內效率懲罰。評估顯示 Qwen3.5-397B-SFT-RL 在 FRAMES 上取得頂尖表現：單次工具呼叫準確率為 57.3%，四次呼叫為 73.9%，每次查詢成本為 $0.02；在這些指標上超越 GPT-5.4 與 Claude Sonnet 4.6。定價採用 API 計費，且不包含快取。

展開

05:38

Prime Intellect 推出 INTELLECT-3 模型

去中心化 AI 協議 Prime Intellect 推出具有 106B 參數的混合專家模型 INTELLECT-3，該模型基於 GLM 4.5 Air Base 模型，並採用 SFT 和 RL 進行訓練。Prime Intellect 在今年 3 月完成 1500 萬美元融資。

展開