Gate News消息，4月24日——DeepSeek已在MIT许可证下发布V4系列开源模型，权重现已在Hugging Face和ModelScope提供。该系列包含两个混合专家 (MoE) 模型：V4-Pro 总参数达1.6万亿，且每token激活49亿，以及V4-Flash 总参数达2840亿，且每token激活130亿。两者都支持100万token的上下文窗口。

该架构带来三项关键升级：一种混合注意力机制，将压缩稀疏注意力 (CSA) 与高度压缩注意力 (HCA) 结合，大幅降低长上下文开销——V4-Pro在1M上下文下的推理FLOPs仅为V3.2的27%，用于在推理过程中存储历史信息的KV缓存 (VRAM) 也仅为V3.2的10%；用流形约束的超连接 (mHC) 替代传统的残差连接，以增强跨层信号传播的稳定性；并采用Muon优化器以实现更快的训练收敛。预训练使用了超过32万亿tokens的数据。

后训练采用两阶段方案：首先通过监督微调 (SFT) 和GRPO强化学习训练领域特定专家，然后通过在线蒸馏将它们合并为单一模型。V4-Pro-Max (最高推理模式) 宣称在顶级代码基准上拥有最强的开源模型实力，并且在推理和智能体任务上与闭源前沿模型之间的差距显著缩小。V4-Flash-Max在足够的计算预算下实现Pro级推理性能，但在纯知识和复杂智能体任务上受限于参数规模。权重以混合FP4+FP8精度存储。

View Source

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

川普政府公布打击 AI 提炼计划，控中企系统性窃取模型能力

AI 行业动态

白宫科技政策办公室（OSTP）总统助理迈克尔·J·克拉齐奥斯（Michael J. Kratsios）于 4 月 23 日发布官方声明，表示特朗普政府掌握信息，显示外国实体（主要位于中国）正在蓄意针对美国大型人工智能公司，通过“数万个代理账户”及越狱技术系统性提取美国 AI 模型能力，并同步公布四项应对措施。

Market Whisper7 分钟前

DeepSeek 推出 V4 开源预览版，技术评分 3206 超越 GPT-5.4

AI 行业动态

DeepSeek 于 4 月 24 日正式推出 V4 预览版系列，以 MIT 许可协议开源，模型权重已同步上线 Hugging Face 及 ModelScope。根据 DeepSeek V4 技术报告，V4-Pro-Max（最高推理力度模式）在 Codeforces 基准取得 3206 分，超越 GPT-5.4。

Market Whisper23 分钟前

寒武纪完成 DeepSeek-V4 的 Day 0 适配，成为中国 AI 芯片生态的重要里程碑

AI 行业动态

Gate 新闻消息，4月24日——寒武纪今天宣布，它已完成 DeepSeek-V4 的 Day 0 适配。DeepSeek-V4 是 DeepSeek 最新的大型语言模型。寒武纪使用其专有的 NeuWare 软件生态系统以及 vLLM 框架完成了该适配。适配代码已同步开源，标志着

GateNews39 分钟前

腾讯开源 Hy3 预览版，代码基准测试较前代提升 40%

AI 行业动态

腾讯于 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式开源 Hy3 预览版大型语言模型，并同步于腾讯云端（Tencent Cloud）提供付费 API 服务。据 Decrypt 于 4 月 24 日报道，Hy3 预览版自 1 月下旬启动训练，截至发布时间历时不足三个月。

Market Whisper46 分钟前

如果不破产，FTX 的投资组合价值达 158 万亿韩元

股票 AI 行业动态

FTX，这家在2022年11月因流动性短缺和资本外流而申请第11章破产保护的中心化加密货币交易所，如果没有崩溃，据Park引用的分析称，本可持有约158.796万亿韩元的投资。

Crypto Frontier49 分钟前

小米披露 MiMo-V2-Pro 训练细节：1T 模型参数，部署成千上万台 GPU

AI 行业动态

Gate News 消息，4月24日——小米的大语言模型团队负责人罗福丽在一场深入采访中透露，MiMo-V2-Pro 模型的总参数量达到 1 万亿，并且训练过程中需要成千上万台 GPU。她表示，1T 规模代表要实现接近 Claude Opus 4.6 等级的性能，并为下一阶段 AI 智能体抢占具备竞争力的入场券所达到的最低门槛

GateNews1小时前

0/400

暂无评论