DeepSeek 于 4 月 24 日正式推出 V4 预览版系列，以 MIT 许可协议开源，模型权重已同步上线 Hugging Face 及 ModelScope。根据 DeepSeek V4 技术报告，V4-Pro-Max（最高推理力度模式）在 Codeforces 基准取得 3206 分，超越 GPT-5.4。

两款 MoE 模型架构规格

根据 DeepSeek V4 技术报告，V4 系列包含两款混合专家（MoE）模型：

V4-Pro：总参数 1.6T，每 token 激活 49B，支持 1M token 上下文

V4-Flash：总参数 284B，每 token 激活 13B，同样支持 1M token 上下文

根据技术报告，V4-Pro 在 1M 上下文下的单 token 推理 FLOPs 仅为 V3.2 的 27%，KV 缓存降至 V3.2 的 10%，主要得益于混合注意力机制（压缩稀疏注意力 CSA ＋重度压缩注意力 HCA）的架构升级。预训练数据规模超过 32T token；训练优化器更新为 Muon。

后训练方法论：在线策略蒸馏取代混合强化学习

根据 DeepSeek V4 技术报告，V4 后训练的核心更新在于以在线策略蒸馏（On-Policy Distillation，OPD）完全取代 V3.2 的混合强化学习（mixed RL）阶段。新流程分为两步：首先针对数学、代码、Agent 及指令跟随等领域分别训练领域专家（SFT ＋ GRPO 强化学习）；随后以多教师 OPD 将十余个专家的能力蒸馏至统一模型，通过 logit 对齐避免传统方法中常见的能力冲突。

报告同时引入生成式奖励模型（Generative Reward Model，GRM），针对难以用规则验证的任务，以少量多样化人工标注数据训练，让模型同时承担生成与评估功能。

基准测试成绩：编码领先，知识推理仍有差距

根据 DeepSeek V4 技术报告，V4-Pro-Max 与 Opus 4.6 Max、GPT-5.4 xHigh 及 Gemini 3.1 Pro High 的对比结果（不含近期发布的 GPT-5.5 及 Opus 4.7）：

Codeforces：3206（GPT-5.4：3168 / Gemini 3.1 Pro：3052）→ 全场最高

LiveCodeBench：93.5 → 全场最高

SWE Verified：80.6，落后 Opus 4.6 的 80.8 差 0.2 个百分点

GPQA Diamond：90.1，落后 Gemini 3.1 Pro 的 94.3

SimpleQA-Verified：57.9，落后 Gemini 3.1 Pro 的 75.6

HLE：37.7，落后 Gemini 3.1 Pro 的 44.4

技术报告同时指出，上述对比不含最近发布的 GPT-5.5 及 Opus 4.7，V4 与最新一代闭源模型的差距有待第三方评测验证。

常见问题

DeepSeek V4 预览版的开源许可条款为何，可在哪里取得？

根据 DeepSeek 4 月 24 日的官方公告，V4 系列以 MIT 许可协议开源，模型权重已上线 Hugging Face 及 ModelScope，适用于商业与学术用途。

DeepSeek V4-Pro 与 V4-Flash 的参数规模有何差异？

根据 DeepSeek V4 技术报告，V4-Pro 总参数为 1.6T，每 token 激活 49B；V4-Flash 总参数为 284B，每 token 激活 13B，两款均支持 1M token 上下文。

DeepSeek V4-Pro-Max 与 GPT-5.4 及 Gemini 3.1 Pro 的基准比较结果为何？

根据 DeepSeek V4 技术报告，V4-Pro-Max 在 Codeforces（3206 分）及 LiveCodeBench（93.5）两项基准超越 GPT-5.4 及 Gemini 3.1 Pro，但在知识密集型基准（GPQA Diamond、SimpleQA-Verified、HLE）上仍落后 Gemini 3.1 Pro；比较组不含 GPT-5.5 及 Opus 4.7。

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

法官驳回埃隆·马斯克在其 OpenAI 诉讼中的欺诈指控；案件进入审判，仍剩两项指控

AI 行业动态

Gate News 消息，4月24日——一名联邦法官驳回了埃隆·马斯克针对 OpenAI 提起的诉讼中的欺诈指控（被告包括 OpenAI、山姆·奥特曼、格雷格·布罗克曼和微软），从而为案件就两项仍然存续的指控进入审判铺平道路：违反慈善信托和不当得利。美国

GateNews1小时前

OpenAI首席执行官萨姆·奥特曼就未向警方报告校园枪手的被禁账户道歉

AI 行业动态

通告新闻，4月25日——OpenAI首席执行官萨姆·奥特曼（Sam Altman）因公司未能就与杰西·范·罗特塞拉尔（Jesse Van Rootselaar）相关的被禁账户通知警方，向加拿大的坦博琳（Tamborine）社区道歉。该账户相关人员在2月份于一所学校杀害了8人，随后自杀。OpenAI

GateNews1小时前

阿联酋宣布在未来两年内转向 AI 政府模式

AI Agent AI 行业动态

谢赫·穆罕默德·本·拉希德·阿勒马克图姆殿下表示，目标是让50%的政府部门通过自治的代理式AI运作。转型还将包括培训联邦雇员以“精通AI”，并将由谢赫·曼苏尔·本·扎耶德监督。要点：

Coinpedia1小时前

AI 交易平台 Fere AI 融资 130 万美元，融资由 Ethereal Ventures 牵头

AI Agent AI 行业动态

Gate News 消息，4 月 25 日——据 Globenewswire 报道，由 Ethereal Ventures 牵头、Galaxy Vision Hill 和 Kosmos Ventures 参与的 130 万美元融资轮已完成，Fere AI（一个由人工智能驱动的数字资产交易平台）宣布了该消息。该平台支持跨链

GateNews2小时前

Google 加码 400 亿美元投资 Anthropic：先付 100 亿、再依业绩释放 300 亿，配 5GW TPU 算力

AI 行业动态

Alphabet 向 Anthropic 追加 400 亿美元，分两阶段：首笔 100 亿美元现金注入、估值 3,800 亿美元；剩余 300 亿美元在业绩达标后分阶段释放。Google Cloud 在五年内提供 5 GW TPU 计算资源；同期 Amazon 也宣布最高 250 亿美元投资，显示 Anthropic 的算力与资本支持同步增强。

鏈新聞abmedia3小时前

SpaceX、OpenAI 和 Anthropic 的 IPO 可能吸引超 $240 Billion 的资金，或将影响加密市场流动性

宏观经济股票 AI 行业动态

Gate News 消息，4 月 25 日——根据市场报道，SpaceX 预计将于 6 月上市，融资目标将超过沙特阿美创下的纪录 $29 billion IPO；与此同时，OpenAI 和 Anthropic 计划在 2026 年下半年上市。这三家公司预计将

GateNews4小时前

0/400

暂无评论