DeepSeek 是一家总部位于杭州的人工智能公司，通过一项名为“图像识别模式”的新功能，向其主聊天机器人新增图像和视频识别能力，使其与其他主要 AI 聊天机器人看齐。该功能发布恰逢中国芯片供应链的一个重大里程碑：四家国内半导体公司——华为昇腾、寒武纪、海光信息和摩尔线程——确认在同一天支持 DeepSeek 最新旗舰模型 DeepSeek-V4，标志着一种转变：相比之下，此前在 Nvidia 生态圈之外通常需要数月的适配期。

DeepSeek 的愿景与模型扩展

DeepSeek 悄然推出图像识别模式，同时还上线了本月早些时候发布的另外两种模式：“专家（expert）”和“闪速（flash）”。据负责 DeepSeek 多模态团队的陈晓康介绍，该工具最初在网站和移动应用上都对一小批用户进行了测试。公司资深研究员陈德礼在一则帖子中庆祝上线，并提到了公司的标志：“小鲸鱼现在能看见了。”

图像与视频功能是在 DeepSeek 发布 DeepSeek-V4 预览并提供模型权重供公众下载和使用后的仅几天内推出的。V4 被设计为两个不同的模型：DeepSeek-V4-Pro，包含 1.6 万亿参数，面向复杂推理与多步骤自动化工作流；DeepSeek-V4-Flash，针对以更低成本处理大量请求进行了优化。两个模型都支持 100 万 tokens 的上下文窗口，并采用混合注意力设计；公司表示该设计能在推理过程中降低算力与内存需求。

中国芯片制造商实现同日上线支持

引发业界关注的并不只是模型本身，而是 V4 发布当天所展示的协同硬件支持。华为昇腾确认其 A2、A3 和 950 芯片兼容，其中昇腾 950 通过融合计算流程与并行处理流来加速对 V4-Pro 和 V4-Flash 的推理。寒武纪使用开源的 vLLM 推理框架完成了适配，并在 GitHub 上发布了代码。海光信息在其 DCU 平台上进行了深度模型优化，以实现从模型发布到部署的顺畅过渡。摩尔线程则与北京人工智能研究院合作，使用 FlagOS 软件栈在其 MTT S5000 卡上运行 V4。

多种芯片平台在同一天提供支持，代表着与历史模式的不同。过去，Nvidia 生态圈之外的硬件通常需要数月才能支持主要新模型。行业观察者指出，在发布当天就实现四种不同国产芯片平台的兼容，表明中国半导体与 AI 基础设施的成熟度出现了真正的变化。

战略含义：成本与供应链自主

DeepSeek 本次发布的更广泛意义，超出了单个技术成果本身。通过让 V4 能够原生同时运行在多种中国芯片上，DeepSeek 降低了对出口限制的依赖风险——这些限制此前一直阻碍中国公司获取最先进的美国处理器。成本效率仍然是 DeepSeek 战略的核心：公司把保持模型运行成本低作为重点，从而让企业能够构建自动化系统，而无需承担难以承受的计算开支。

行业观察者将这一发布描述为体现了整条供应链的成熟，而不仅仅是一项单独的技术突破。DeepSeek、芯片制造商与软件框架之间的协同，展示了完善的生态系统一体化发展。这一路线表明，AI 的竞争格局正在从关注单个模型的复杂性，转向长期维持完整、具成本效益且自主的系统能力。

常见问题（FAQ）

DeepSeek 为其聊天机器人新增了哪些新能力？
DeepSeek 新增了“图像识别模式”，使其聊天机器人不仅能理解文本，还能理解照片和视频。该功能最初在网站和移动应用上对一小批用户进行了测试，从而使 DeepSeek 的能力与其他提供类似能力的主要 AI 聊天机器人保持一致。

发布当天有哪些中国芯片公司支持 DeepSeek-V4？
四家中国芯片公司确认在发布当天支持 DeepSeek-V4：华为昇腾 (使用 A2、A3 和 950 芯片)、寒武纪、海光信息以及摩尔线程。此前，在 Nvidia 生态圈之外，多芯片平台在同一天实现兼容性一直较为罕见，通常需要数月的适配工作。

DeepSeek-V4 的两个版本是什么？它们有什么区别？
DeepSeek-V4-Pro 具备 1.6 万亿参数，面向复杂推理与多步骤自动化工作流；而 DeepSeek-V4-Flash 针对以更低成本处理大量请求进行了优化。两者都支持 100 万 tokens 的上下文窗口，并使用混合注意力设计，以降低算力与内存需求。

View Source

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

0/400

RugProofRita

· 24 分钟前

刚试了下识图，中文理解确实比某家强

ybaser

· 1小时前

紧握不放 HODL💎 紧握不放 HODL💎

查看原文回复0

GateUser-0b71fc11

· 2小时前

从纯文本到多模态，半年走完别人两年的路

镜面球看天

· 2小时前

别光吹，RAG幻觉问题解决了吗

GateUser-ced0257a

· 2小时前

视频识别？求测个复杂场景的稳定性

GateUser-8f9ccfec

· 2小时前

这发布时间卡得妙，正好蹭上芯片热点

GateUser-cb789e81

· 2小时前

成本打下来才是真本事，等API价格

Gas费焦虑症

· 2小时前

最后问句：啥时候开放给免费用户

GateUser-f78f1f3e

· 2小时前

芯片里程碑+功能升级，双喜临门？

GateUser-06596f3b

· 2小时前

多模态赛道现在没这功能不好意思出门