
騰訊於 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式開源 Hy3 預覽版大型語言模型,並同步於騰訊雲端(Tencent Cloud)提供付費 API 服務。據 Decrypt 於 4 月 24 日報導,Hy3 預覽版自 1 月下旬啟動訓練,至發布日歷時不足三個月。
Hy3 模型架構與開發背景
根據騰訊官方公告,Hy3 預覽版為混合專家架構,將各查詢路由至指定專家子網路子集處理,而非同步啟用全部參數,以降低計算需求。
前一代旗艦模型 Hy2 的參數量逾 4,000 億。騰訊官方聲明指出,2,950 億為推理效益最佳化後的設定,超出此規模後增加參數的邊際效益不再合算。
根據 Decrypt 報導,Hy3 的訓練工作由騰訊首席人工智慧科學家姚順宇(Yao Shunyu)主導,其於 2026 年 2 月完成預訓練與強化學習堆疊的基礎設施重建後,Hy3 訓練正式展開。
關鍵基準測試數據
根據騰訊官方公告所披露的基準測試結果:
SWE-bench Verified(GitHub 真實程式碼錯誤修復):Hy3 預覽版 74.4%,Hy2 為 53.0%;同期 GLM-5 為 77.8%,Kimi-K2.5 為 76.8%,Claude Opus 4.6 為 80.8%
Terminal-Bench 2.0(命令列自主任務執行):Hy3 預覽版 54.4%,Hy2 為 23.2%
BrowseComp(複雜網路搜尋任務):Hy3 預覽版 67.1%,Hy2 為 28.7%
WideSearch:Hy3 預覽版 70.2%,高於 GLM-5 及 Kimi-K2.5,低於 Claude Opus 4.6 的 77.2%
清華大學數學博士資格考試(2026 年春季):三次運行平均分(avg@3)88.4,為中國模型最高分
2025 年中國高中生物奧林匹克競賽(CHSBO 2025):87.8 分,為同類中國模型最高分
部署平台與 API 定價
根據騰訊官方公告,Hy3 預覽版已部署於以下平台:元寶(Yuanbao)、QQ、騰訊文件(Tencent Docs)、CodeBuddy、WorkBuddy 及 OpenClaw。
騰訊雲端 API 定價為每百萬輸入標記 0.18 美元、每百萬輸出標記 0.59 美元;個人標記計劃月費起價約 4.10 美元。騰訊公告亦顯示,Hy3 在 CodeBuddy 與 WorkBuddy 上的首標記延遲較前代降低 54%,端對端生成時間縮短 47%,並成功完成 495 步驟的代理工作流程。
常見問題
騰訊 Hy3 預覽版何時發布,可在哪些平台取得?
根據騰訊官方公告及 Decrypt 2026 年 4 月 24 日報導,Hy3 預覽版於 2026 年 4 月 23 日(週四)在 GitHub、Hugging Face 及 ModelScope 開源,騰訊雲端同步提供付費 API 服務。
Hy3 預覽版與前代模型 Hy2 相比,主要基準測試差異為何?
根據騰訊官方公告,SWE-bench Verified 評分由 Hy2 的 53.0% 升至 74.4%;BrowseComp 由 28.7% 升至 67.1%;Terminal-Bench 2.0 由 23.2% 升至 54.4%。
Hy3 預覽版的 API 定價為何?
根據騰訊雲端官方定價,Hy3 預覽版 API 起價為每百萬輸入標記 0.18 美元,每百萬輸出標記 0.59 美元;個人標記計劃月費起價約 4.10 美元。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Helsing 目標以 180 億美元估值籌集資金
根據《金融時報》,德國 AI 驅動無人機新創公司 Helsing 正計劃以約 180 億美元估值籌集新一輪資金。
GateNews14分鐘前
Google DeepMind AI 合作數學家在 FrontierMath 第 4 階段達成 47.9%,超越 GPT-5.5 Pro,解決 3 個先前無法解決的問題
Google DeepMind 發布 AI 合數學家(AI co-mathematician),一款多代理數學研究助理,在 FrontierMath 第 4 層級基準測試中達到 47.9% 的準確率,超越 GPT-5.5 Pro 先前在 5 月 9 日創下的 39.6% 記錄。該系統解出 48 題中的 23 題,包括 3 題是所有先前模型都無法解答的。系統基於 Gemini 3.1 Pro,採用分層架構:由專案協調員代理(project coordinator agent)分派任務給負責文獻檢索、編碼與推理的子代理(sub-agents),並由多個審查員代理(reviewer agents)在提交前驗證證明。 Epoch AI 進行了盲測,使 DeepMind 團隊無法看到題目;每道題目允許進行 48 小時的運算。在真實世界的應用中,數學家 Marc Lackenby 使用該系統解決了來自 Kourovka Notebook 的一個未解推測,展現其實際研究價值。目前該系統正以內測形式提供給少數數學家使用。
GateNews22分鐘前
OpenAI 的獎勵系統意外地在包含 GPT-5.4 的 6 個模型上為思考鏈打分
根據 OpenAI 的對齊團隊,該公司近期發現一項影響 6 個大型語言模型(包含 GPT-5.4)的關鍵訓練錯誤:獎勵機制不慎對模型的思考鏈進行了評分,也就是在生成答案之前的內部推理過程。GPT-5.5 不受影響。 此事件違反一項基本的 AI 安全原則:思考鏈絕不應被納入評估,因為這樣做可能會促使模型編造推理內容,以取得更高分數。 有缺陷的評分系統在判斷回覆是否有用,或模型是否已被攻擊所破壞時,錯誤地將思考鏈納入考量。受影響的訓練樣本占資料集的比例最多為 3.8%。OpenAI 已修補此漏洞,並進行了比較性實驗,確認模型沒有發展出具欺瞞性的行為。該公司已在所有訓練流程中部署自動化掃描系統,以防止再次發生。
GateNews1小時前
阿里巴巴未與 DeepSeek 進行談判,市場消息人士於 5 月 9 日澄清
據《財新日報》在 5 月 9 日報導的市場消息,阿里巴巴並未就融資一事與深度求索(DeepSeek)進行磋商。這項澄清是在先前媒體報導指出兩家公司之間的談判已告破裂之後作出。深度求索在 4 月推出了一輪規模可觀的融資,吸引了騰訊與阿里巴巴的關注。
GateNews2小時前
OpenAI 發布 Codex 遷移工具,可匯入來自競爭型 AI 助手的設定檔
根據 OneMillionAI(Beating)報導,OpenAI 已在 Codex 內發布一款遷移工具,讓使用者可匯入其他 AI 編碼助理的設定與資料,包括 Claude Code。該工具透過 OpenAI 官方 Twitter 帳號宣布,能自動轉移系統提示詞、客製化技能、30 天的聊天歷史、MCP 伺服器設定、hooks 以及子代理設定。 OpenAI 表示,遷移工具可透過 Codex 設定中的「匯入其他代理設定」選項,對多數設定進行自動處理。對於不相容的設定,該工具會啟動引導式對話,協助使用者進行手動遷移。公司建議使用者在遷移後核實權限與驗證設定,因為不同平台之間的權限系統無法相互相容。
GateNews2小時前
字節跳動在 5 月 9 日將 AI 基礎設施支出提高 25% 至 2000 億人民幣
根據媒體報導,字節跳動將其原定的 AI 基礎設施支出在 2026 年提高 25%,至 2000 億人民幣,隨著記憶體晶片需求上升,公司加速部署人工智慧
GateNews3小時前