Gate News 消息,4月22日——普林斯顿大学 PhD 学生 Yifan Zhang 在 X 上披露了 DeepSeek V4 的完整技术规格,此前于 4月19日进行了预览。V4 拥有 1.6 万亿(1.6 trillion)总参数,并提供轻量化变体 V4-Lite,参数规模为 2850 亿(285 billion)。
该模型采用 DSA2 注意力机制,该机制结合了 DeepSeek 先前在 V3.2 中的 DSA (DeepSeek Sparse Attention) 以及 NSA (Native Sparse Attention)(并配备 512 维的头部嵌入),再配套使用稀疏多查询注意力 (MQA) 与滑动窗口注意力 (SWA)。MoE (Mixture of Experts) 层包含 384 位专家,每次前向传递激活 6 位,使用 Fused MoE Mega-Kernel。残差连接采用 Hyper-Connections 架构。
首次披露的训练细节包括:使用 Muon 优化器 (applying Newton-Schulz orthogonalization to momentum updates),32K token 的预训练上下文窗口,以及在强化学习期间使用 GRPO (Group Relative Policy Optimization) 并进行 KL 散度修正。最终上下文窗口扩展至 100 万(1 million)tokens。该模型为仅文本模型。
Zhang 并未受雇于 DeepSeek,公司也尚未对所披露信息作出官方评论。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
OpenClaw、Hermes 和 SillyTavern 已确认纳入 GLM 编程计划支持
智谱AI产品经理李宣布 OpenClaw、Hermes 和 SillyTavern 作为受支持的 GLM 编程计划项目;其他工具将逐案评估。不要共享凭据或使用订阅作为 API 访问;遇到错误 1313 请联系支持。
智谱AI产品经理李宣布 OpenClaw、Hermes 和 SillyTavern 在 GLM 编程计划下已获官方支持,其他工具将逐案评估。该说明提醒用户不要共享凭据或将订阅用作 API 访问,并指引遇到错误 1313 的用户联系支持。
GateNews19 分钟前
Google Cloud 首席执行官:Gemini 将在 2026 年驱动苹果的个性化 Siri 推出
摘要:Gemini 将在 2026 年为个性化的 Apple Siri 提供支持,该产品基于苹果的 Foundation Models,并与 Gemini 展开合作;苹果正在测试 iOS 27/macOS 27 中类似聊天的 Siri,预计将在 2026 年 WWDC 上发布。
概述:到 2026 年,Google Cloud 的 Gemini 将为个性化的 Apple Siri 提供支持,将 Gemini 与苹果的 Foundation Models 进行融合,并在一项大约 $1 十亿美元的合作框架下推进。苹果正在 iOS 27/macOS 27 中测试一款重新设计、类似聊天的 Siri,采用 Dynamic Island 界面并提供新功能,距离 6 月 8 日举行的 2026 年 WWDC 揭晓仅在前期。
GateNews50 分钟前
SpaceX $60B Cursor 合作点燃 SBF 的赦免推动,FTX 的 $200K 持仓现价值达 30 亿美元
Gate News 消息,4月22日——SpaceX 今天宣布与 AI 编程初创公司 Cursor 达成重大合作,并提供了以 $60 十亿美元收购该公司的选项。该交易为 Sam Bankman-Fried (SBF) 提供了新的弹药;他目前身陷囹圄,正推动总统赦免,因为这表明了他长期所声称的 FTX 本可以实现的潜在价值回收。
在 2022 年 4 月,Alameda Research(SBF 创立的交易公司)向 Cursor 的母公司 Anysphere 投资了 200,000 美元,获得约 5% 的股权。当 FTX 在 2022 年 11 月崩溃时,破产法院接管了该公司。2023 年 4 月,FTX 破产财产将这同样的 5% 股权以 200,000 美元出售——正是 Alameda 投资的相同金额。基于 SpaceX 今天公布的 十亿美元估值,这 5% 的股权如今将价值约 十亿美元,代表 15,000 倍回报。
SBF 长期以来一直声称 FTX 并不是真正资不抵债,并认为破产律师通过过早清算资产摧毁了价值。2026 年 2 月,他分享了预测,暗示 FTX 在资产回收后本可以达到 十亿美元的净资产价值。他的父母在寻求赦免方面也一直很活跃,3 月出现在 CNN 上,辩称 FTX 客户获得了全额偿付。然而,债权人指出,赔付基于的是 2022 年的估值,而非当前市场价格。特朗普总统表示他不会赦免 SBF,而预测市场目前估计 2026 年获得赦免的概率仅为 5%。
GateNews58 分钟前
Chegg 股票暴跌99%,AI 冲击教育科技市场
摘要:Chegg 在在线教育需求带动下飙升,随后 AI 工具扰乱了其商业模式,引发大规模裁员,并使股价跌破 $2;与此同时,受更广泛的 AI 驱动变革影响,面向加密货币的矿企和金融科技公司也遭遇冲击。
摘要:本文考察了 Chegg 在疫情时期作为在线教育宠儿的崛起,以及在生成式 AI 的快速采用下它随后的衰落。生成式 AI 能提供快速答案,从而削弱了 Chegg 的价值主张。文章记录了 2025 年的裁员情况以及股价朝退市方向的大幅下跌,并将 Chegg 的经历置于更广泛的 AI 颠覆之中:这种颠覆正在重塑科技与加密领域——比特币矿工转向 AI 运维,而金融科技及其他领域的 AI 原生策略重新定义了竞争力。
Crypto Frontier1小时前
OpenAI 发布开源隐私过滤器模型,用于检测与脱敏 PII
摘要:OpenAI 的隐私过滤器是一种开源、可在本地运行的模型,用于检测并在文本中脱敏个人身份信息(PII)。它支持大上下文,识别多种 PII 类型,并旨在用于注重隐私的工作流程,例如数据准备、索引、日志记录和内容审核。
OpenAI 的隐私过滤器是一种在本地运行的开源模型 (128k-token 上下文),可检测并在文本中脱敏个人身份信息(PII),用于隐私工作流程,涵盖联系方式、金融和凭据数据。
GateNews1小时前
OpenAI 计划在 2030 年前部署 30GW 算力
OpenAI 计划在 2030 年前实现 30GW 的算力,以满足不断增长的 AI 需求,其中已完成 10GW 目标中的 8GW(对应 2025 年)。这次扩张表明了一项扩展基础设施的战略,以支撑下一代 AI 的开发与部署。
OpenAI 打算在 2030 年前达到 30GW 的算力,以适应日益增长的 AI 需求,且已完成 2025 年 10GW 目标中的 8GW。此举体现了为支撑下一代 AI 的开发与部署而对基础设施进行战略性扩张。
GateNews1小时前