DeepSeek 推出 V4 开源预览版,技术评分 3206 超越 GPT-5.4

Market Whisper

DeepSeek V4開源預覽版

DeepSeek 于 4 月 24 日正式推出 V4 预览版系列,以 MIT 许可协议开源,模型权重已同步上线 Hugging Face 及 ModelScope。根据 DeepSeek V4 技术报告,V4-Pro-Max(最高推理力度模式)在 Codeforces 基准取得 3206 分,超越 GPT-5.4。

两款 MoE 模型架构规格

根据 DeepSeek V4 技术报告,V4 系列包含两款混合专家(MoE)模型:

V4-Pro:总参数 1.6T,每 token 激活 49B,支持 1M token 上下文

V4-Flash:总参数 284B,每 token 激活 13B,同样支持 1M token 上下文

根据技术报告,V4-Pro 在 1M 上下文下的单 token 推理 FLOPs 仅为 V3.2 的 27%,KV 缓存降至 V3.2 的 10%,主要得益于混合注意力机制(压缩稀疏注意力 CSA + 重度压缩注意力 HCA)的架构升级。预训练数据规模超过 32T token;训练优化器更新为 Muon。

后训练方法论:在线策略蒸馏取代混合强化学习

根据 DeepSeek V4 技术报告,V4 后训练的核心更新在于以在线策略蒸馏(On-Policy Distillation,OPD)完全取代 V3.2 的混合强化学习(mixed RL)阶段。新流程分为两步:首先针对数学、代码、Agent 及指令跟随等领域分别训练领域专家(SFT + GRPO 强化学习);随后以多教师 OPD 将十余个专家的能力蒸馏至统一模型,通过 logit 对齐避免传统方法中常见的能力冲突。

报告同时引入生成式奖励模型(Generative Reward Model,GRM),针对难以用规则验证的任务,以少量多样化人工标注数据训练,让模型同时承担生成与评估功能。

基准测试成绩:编码领先,知识推理仍有差距

根据 DeepSeek V4 技术报告,V4-Pro-Max 与 Opus 4.6 Max、GPT-5.4 xHigh 及 Gemini 3.1 Pro High 的对比结果(不含近期发布的 GPT-5.5 及 Opus 4.7):

Codeforces:3206(GPT-5.4:3168 / Gemini 3.1 Pro:3052)→ 全场最高

LiveCodeBench:93.5 → 全场最高

SWE Verified:80.6,落后 Opus 4.6 的 80.8 差 0.2 个百分点

GPQA Diamond:90.1,落后 Gemini 3.1 Pro 的 94.3

SimpleQA-Verified:57.9,落后 Gemini 3.1 Pro 的 75.6

HLE:37.7,落后 Gemini 3.1 Pro 的 44.4

技术报告同时指出,上述对比不含最近发布的 GPT-5.5 及 Opus 4.7,V4 与最新一代闭源模型的差距有待第三方评测验证。

常见问题

DeepSeek V4 预览版的开源许可条款为何,可在哪里取得?

根据 DeepSeek 4 月 24 日的官方公告,V4 系列以 MIT 许可协议开源,模型权重已上线 Hugging Face 及 ModelScope,适用于商业与学术用途。

DeepSeek V4-Pro 与 V4-Flash 的参数规模有何差异?

根据 DeepSeek V4 技术报告,V4-Pro 总参数为 1.6T,每 token 激活 49B;V4-Flash 总参数为 284B,每 token 激活 13B,两款均支持 1M token 上下文。

DeepSeek V4-Pro-Max 与 GPT-5.4 及 Gemini 3.1 Pro 的基准比较结果为何?

根据 DeepSeek V4 技术报告,V4-Pro-Max 在 Codeforces(3206 分)及 LiveCodeBench(93.5)两项基准超越 GPT-5.4 及 Gemini 3.1 Pro,但在知识密集型基准(GPQA Diamond、SimpleQA-Verified、HLE)上仍落后 Gemini 3.1 Pro;比较组不含 GPT-5.5 及 Opus 4.7。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

法官驳回埃隆·马斯克在其 OpenAI 诉讼中的欺诈指控;案件进入审判,仍剩两项指控

Gate News 消息,4月24日——一名联邦法官驳回了埃隆·马斯克针对 OpenAI 提起的诉讼中的欺诈指控(被告包括 OpenAI、山姆·奥特曼、格雷格·布罗克曼和微软),从而为案件就两项仍然存续的指控进入审判铺平道路:违反慈善信托和不当得利。美国

GateNews1小时前

OpenAI首席执行官萨姆·奥特曼就未向警方报告校园枪手的被禁账户道歉

通告新闻,4月25日——OpenAI首席执行官萨姆·奥特曼(Sam Altman)因公司未能就与杰西·范·罗特塞拉尔(Jesse Van Rootselaar)相关的被禁账户通知警方,向加拿大的坦博琳(Tamborine)社区道歉。该账户相关人员在2月份于一所学校杀害了8人,随后自杀。OpenAI

GateNews1小时前

阿联酋宣布在未来两年内转向 AI 政府模式

谢赫·穆罕默德·本·拉希德·阿勒马克图姆殿下表示,目标是让50%的政府部门通过自治的代理式AI运作。转型还将包括培训联邦雇员以“精通AI”,并将由谢赫·曼苏尔·本·扎耶德监督。 要点:

Coinpedia1小时前

AI 交易平台 Fere AI 融资 130 万美元,融资由 Ethereal Ventures 牵头

Gate News 消息,4 月 25 日——据 Globenewswire 报道,由 Ethereal Ventures 牵头、Galaxy Vision Hill 和 Kosmos Ventures 参与的 130 万美元融资轮已完成,Fere AI(一个由人工智能驱动的数字资产交易平台)宣布了该消息。 该平台支持跨链

GateNews2小时前

Google 加码 400 亿美元投资 Anthropic:先付 100 亿、再依业绩释放 300 亿,配 5GW TPU 算力

Alphabet 向 Anthropic 追加 400 亿美元,分两阶段:首笔 100 亿美元现金注入、估值 3,800 亿美元;剩余 300 亿美元在业绩达标后分阶段释放。Google Cloud 在五年内提供 5 GW TPU 计算资源;同期 Amazon 也宣布最高 250 亿美元投资,显示 Anthropic 的算力与资本支持同步增强。

鏈新聞abmedia3小时前

SpaceX、OpenAI 和 Anthropic 的 IPO 可能吸引超 $240 Billion 的资金,或将影响加密市场流动性

Gate News 消息,4 月 25 日——根据市场报道,SpaceX 预计将于 6 月上市,融资目标将超过沙特阿美创下的纪录 $29 billion IPO;与此同时,OpenAI 和 Anthropic 计划在 2026 年下半年上市。这三家公司预计将

GateNews4小时前
评论
0/400
暂无评论