DeepSeek 於 4 月 24 日正式推出 V4 預覽版系列，以 MIT 許可協議開源，模型權重已同步上線 Hugging Face 及 ModelScope。根據 DeepSeek V4 技術報告，V4-Pro-Max（最高推理力度模式）在 Codeforces 基準取得 3206 分，超越 GPT-5.4。

兩款 MoE 模型架構規格

根據 DeepSeek V4 技術報告，V4 系列包含兩款混合專家（MoE）模型：

V4-Pro：總參數 1.6T，每 token 激活 49B，支援 1M token 上下文

V4-Flash：總參數 284B，每 token 激活 13B，同樣支援 1M token 上下文

根據技術報告，V4-Pro 在 1M 上下文下的單 token 推理 FLOPs 僅為 V3.2 的 27%，KV 緩存降至 V3.2 的 10%，主要得益於混合注意力機制（壓縮稀疏注意力 CSA ＋重度壓縮注意力 HCA）的架構升級。預訓練數據規模超過 32T token；訓練優化器更新為 Muon。

後訓練方法論：在線策略蒸餾取代混合強化學習

根據 DeepSeek V4 技術報告，V4 後訓練的核心更新在於以在線策略蒸餾（On-Policy Distillation，OPD）完全取代 V3.2 的混合強化學習（mixed RL）階段。新流程分為兩步：首先針對數學、程式碼、Agent 及指令跟隨等領域分別訓練領域專家（SFT ＋ GRPO 強化學習）；隨後以多教師 OPD 將十餘個專家的能力蒸餾至統一模型，透過 logit 對齊避免傳統方法中常見的能力衝突。

報告同時引入生成式獎勵模型（Generative Reward Model，GRM），針對難以用規則驗證的任務，以少量多樣化人工標注數據訓練，讓模型同時承擔生成與評估功能。

基準測試成績：編碼領先，知識推理仍有差距

根據 DeepSeek V4 技術報告，V4-Pro-Max 與 Opus 4.6 Max、GPT-5.4 xHigh 及 Gemini 3.1 Pro High 的對比結果（不含近期發布的 GPT-5.5 及 Opus 4.7）：

Codeforces：3206（GPT-5.4：3168 / Gemini 3.1 Pro：3052）→ 全場最高

LiveCodeBench：93.5 → 全場最高

SWE Verified：80.6，落後 Opus 4.6 的 80.8 差 0.2 個百分點

GPQA Diamond：90.1，落後 Gemini 3.1 Pro 的 94.3

SimpleQA-Verified：57.9，落後 Gemini 3.1 Pro 的 75.6

HLE：37.7，落後 Gemini 3.1 Pro 的 44.4

技術報告同時指出，上述對比不含最近發布的 GPT-5.5 及 Opus 4.7，V4 與最新一代閉源模型的差距有待第三方評測驗證。

常見問題

DeepSeek V4 預覽版的開源授權條款為何，可在哪裡取得？

根據 DeepSeek 4 月 24 日的官方公告，V4 系列以 MIT 許可協議開源，模型權重已上線 Hugging Face 及 ModelScope，適用於商業與學術用途。

DeepSeek V4-Pro 與 V4-Flash 的參數規模有何差異？

根據 DeepSeek V4 技術報告，V4-Pro 總參數為 1.6T，每 token 激活 49B；V4-Flash 總參數為 284B，每 token 激活 13B，兩款均支援 1M token 上下文。

DeepSeek V4-Pro-Max 與 GPT-5.4 及 Gemini 3.1 Pro 的基準比較結果為何？

根據 DeepSeek V4 技術報告，V4-Pro-Max 在 Codeforces（3206 分）及 LiveCodeBench（93.5）兩項基準超越 GPT-5.4 及 Gemini 3.1 Pro，但在知識密集型基準（GPQA Diamond、SimpleQA-Verified、HLE）上仍落後 Gemini 3.1 Pro；比較組不含 GPT-5.5 及 Opus 4.7。

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

DeepSeek 以 $20B 估值尋求 18 億美元融資，伴隨人才外流

AI 行業動態

Gate 新聞訊息，4月25日——據知情人士稱，DeepSeek 正計劃籌集 18 億美元，對該公司估值約為 $20 billion。此次融資之所以啟動，是因為這家 AI 新創公司面臨顯著的人才流失，多位核心研究人員已離職，準備加入字節跳動、騰訊、小米，以及自動駕駛公司 Horizon Robotics。

GateNews3小時前

法官駁回 Elon Musk 在其 OpenAI 訴訟中的詐欺指控；案件將隨兩項剩餘指控進入審判

AI 行業動態

Gate News 訊息，4 月 24 日——一名聯邦法官駁回了 Elon Musk 針對 OpenAI、Sam Altman、Greg Brockman 與 Microsoft 提出的訴訟中的詐欺指控，為案件就剩下的兩項指控進入審判鋪平道路：違反慈善信託與不當得利。美國。

GateNews6小時前

OpenAI執行長山姆·奧特曼為未向警方通報校園槍手的被封禁帳號道歉

AI 行業動態

閘門新聞訊息，4月25日——OpenAI首席執行官山姆·奧特曼向加拿大Tamborine社區道歉，因為該公司未能就與Jesse Van Rootselaar相關的被封禁帳號通知警方；該名人士於2月在一所學校殺害8人後自盡。OpenAI

GateNews7小時前

阿聯酋宣布：未來兩年將轉向 AI 政府模式

AI Agent AI 行業動態

他的陛下謝赫·穆罕默德·本·拉希德·阿爾·馬克圖姆表示，目標是讓 50% 的政府部門透過自主型代理式 AI 運作。轉型也將包括培訓聯邦公務員以「精通 AI」，並將由謝赫·曼蘇爾·本·扎耶德監督。重點整理：

Coinpedia7小時前

AI 交易平台 Fere AI 融資 130 萬美元，由 Ethereal Ventures 領投

AI Agent AI 行業動態

Gate News 消息，4月25日——Fere AI 是一個由人工智能驅動的數位資產交易平台，據 Globenewswire 報導，該平台宣布已完成一輪由 Ethereal Ventures 領投、融資金額為 130 萬美元的融資，參與方包括 Galaxy Vision Hill 與 Kosmos Ventures。平台支援跨鏈

GateNews8小時前

Google 加碼 400 億美元投資 Anthropic：先付 100 億、再依業績釋放 300 億，配 5GW TPU 算力

AI 行業動態

Alphabet 對 Anthropic 加碼至 400 億美元，分兩階段：首筆 100 億美元現金注入、估值 3,800 億美元；剩餘 300 億美元於業績達標後分階段釋放。Google Cloud 五年內提供 5 GW TPU 計算資源；同期 Amazon 也宣布最高 250 億美元投資，顯示 Anthropic 的算力與資本支援同步增強。

鏈新聞abmedia8小時前

留言

0/400

暫無留言