DeepSeek 推出 V4 開源預覽版,技術評分 3206 超越 GPT-5.4

Market Whisper

DeepSeek V4開源預覽版

DeepSeek 於 4 月 24 日正式推出 V4 預覽版系列,以 MIT 許可協議開源,模型權重已同步上線 Hugging Face 及 ModelScope。根據 DeepSeek V4 技術報告,V4-Pro-Max(最高推理力度模式)在 Codeforces 基準取得 3206 分,超越 GPT-5.4。

兩款 MoE 模型架構規格

根據 DeepSeek V4 技術報告,V4 系列包含兩款混合專家(MoE)模型:

V4-Pro:總參數 1.6T,每 token 激活 49B,支援 1M token 上下文

V4-Flash:總參數 284B,每 token 激活 13B,同樣支援 1M token 上下文

根據技術報告,V4-Pro 在 1M 上下文下的單 token 推理 FLOPs 僅為 V3.2 的 27%,KV 緩存降至 V3.2 的 10%,主要得益於混合注意力機制(壓縮稀疏注意力 CSA + 重度壓縮注意力 HCA)的架構升級。預訓練數據規模超過 32T token;訓練優化器更新為 Muon。

後訓練方法論:在線策略蒸餾取代混合強化學習

根據 DeepSeek V4 技術報告,V4 後訓練的核心更新在於以在線策略蒸餾(On-Policy Distillation,OPD)完全取代 V3.2 的混合強化學習(mixed RL)階段。新流程分為兩步:首先針對數學、程式碼、Agent 及指令跟隨等領域分別訓練領域專家(SFT + GRPO 強化學習);隨後以多教師 OPD 將十餘個專家的能力蒸餾至統一模型,透過 logit 對齊避免傳統方法中常見的能力衝突。

報告同時引入生成式獎勵模型(Generative Reward Model,GRM),針對難以用規則驗證的任務,以少量多樣化人工標注數據訓練,讓模型同時承擔生成與評估功能。

基準測試成績:編碼領先,知識推理仍有差距

根據 DeepSeek V4 技術報告,V4-Pro-Max 與 Opus 4.6 Max、GPT-5.4 xHigh 及 Gemini 3.1 Pro High 的對比結果(不含近期發布的 GPT-5.5 及 Opus 4.7):

Codeforces:3206(GPT-5.4:3168 / Gemini 3.1 Pro:3052)→ 全場最高

LiveCodeBench:93.5 → 全場最高

SWE Verified:80.6,落後 Opus 4.6 的 80.8 差 0.2 個百分點

GPQA Diamond:90.1,落後 Gemini 3.1 Pro 的 94.3

SimpleQA-Verified:57.9,落後 Gemini 3.1 Pro 的 75.6

HLE:37.7,落後 Gemini 3.1 Pro 的 44.4

技術報告同時指出,上述對比不含最近發布的 GPT-5.5 及 Opus 4.7,V4 與最新一代閉源模型的差距有待第三方評測驗證。

常見問題

DeepSeek V4 預覽版的開源授權條款為何,可在哪裡取得?

根據 DeepSeek 4 月 24 日的官方公告,V4 系列以 MIT 許可協議開源,模型權重已上線 Hugging Face 及 ModelScope,適用於商業與學術用途。

DeepSeek V4-Pro 與 V4-Flash 的參數規模有何差異?

根據 DeepSeek V4 技術報告,V4-Pro 總參數為 1.6T,每 token 激活 49B;V4-Flash 總參數為 284B,每 token 激活 13B,兩款均支援 1M token 上下文。

DeepSeek V4-Pro-Max 與 GPT-5.4 及 Gemini 3.1 Pro 的基準比較結果為何?

根據 DeepSeek V4 技術報告,V4-Pro-Max 在 Codeforces(3206 分)及 LiveCodeBench(93.5)兩項基準超越 GPT-5.4 及 Gemini 3.1 Pro,但在知識密集型基準(GPQA Diamond、SimpleQA-Verified、HLE)上仍落後 Gemini 3.1 Pro;比較組不含 GPT-5.5 及 Opus 4.7。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

DeepSeek 以 $20B 估值尋求 18 億美元融資,伴隨人才外流

Gate 新聞訊息,4月25日——據知情人士稱,DeepSeek 正計劃籌集 18 億美元,對該公司估值約為 $20 billion。此次融資之所以啟動,是因為這家 AI 新創公司面臨顯著的人才流失,多位核心研究人員已離職,準備加入字節跳動、騰訊、小米,以及自動駕駛公司 Horizon Robotics。

GateNews3小時前

法官駁回 Elon Musk 在其 OpenAI 訴訟中的詐欺指控;案件將隨兩項剩餘指控進入審判

Gate News 訊息,4 月 24 日——一名聯邦法官駁回了 Elon Musk 針對 OpenAI、Sam Altman、Greg Brockman 與 Microsoft 提出的訴訟中的詐欺指控,為案件就剩下的兩項指控進入審判鋪平道路:違反慈善信託與不當得利。美國。

GateNews6小時前

OpenAI執行長山姆·奧特曼為未向警方通報校園槍手的被封禁帳號道歉

閘門新聞訊息,4月25日——OpenAI首席執行官山姆·奧特曼向加拿大Tamborine社區道歉,因為該公司未能就與Jesse Van Rootselaar相關的被封禁帳號通知警方;該名人士於2月在一所學校殺害8人後自盡。OpenAI

GateNews7小時前

阿聯酋宣布:未來兩年將轉向 AI 政府模式

他的陛下謝赫·穆罕默德·本·拉希德·阿爾·馬克圖姆表示,目標是讓 50% 的政府部門透過自主型代理式 AI 運作。轉型也將包括培訓聯邦公務員以「精通 AI」,並將由謝赫·曼蘇爾·本·扎耶德監督。 重點整理:

Coinpedia7小時前

AI 交易平台 Fere AI 融資 130 萬美元,由 Ethereal Ventures 領投

Gate News 消息,4月25日——Fere AI 是一個由人工智能驅動的數位資產交易平台,據 Globenewswire 報導,該平台宣布已完成一輪由 Ethereal Ventures 領投、融資金額為 130 萬美元的融資,參與方包括 Galaxy Vision Hill 與 Kosmos Ventures。 平台支援跨鏈

GateNews8小時前

Google 加碼 400 億美元投資 Anthropic:先付 100 億、再依業績釋放 300 億,配 5GW TPU 算力

Alphabet 對 Anthropic 加碼至 400 億美元,分兩階段:首筆 100 億美元現金注入、估值 3,800 億美元;剩餘 300 億美元於業績達標後分階段釋放。Google Cloud 五年內提供 5 GW TPU 計算資源;同期 Amazon 也宣布最高 250 億美元投資,顯示 Anthropic 的算力與資本支援同步增強。

鏈新聞abmedia8小時前
留言
0/400
暫無留言