🔥 Gate 广场活动:#发帖赢代币NIGHT 🔥
发布任意与 NIGHT 相关内容即可参与!
观点分享、行情分析、参与体验、投研笔记通通都算有效参与。
📅 活动时间:2025/12/10 16:00 - 12/21 24:00(UTC+8)
📌 参与方式
1️⃣ 在 Gate 广场发帖(文字 / 图文 / 分析 / 观点均可)
2️⃣ 帖子需添加话题 #发帖赢代币NIGHT 或 #PostToWinNIGHT
🏆 奖励设置(总计 1,000 NIGHT)
🥇 Top 1:200 NIGHT
🥈 Top 4:100 NIGHT / 人
🥉 Top 10:40 NIGHT / 人
📄 注意事项
内容需原创,不得抄袭或灌水
获奖者需完成 Gate 广场身份认证
Gate 对活动拥有最终解释权
Mistral强势回归,推出与DeepSeek正面竞争的Frontier AI系列
Decrypt的艺术、时尚与娱乐中心。
探索SCENE
法国AI初创公司Mistral,常被视为在美中巨头主导领域中的欧洲“陪跑者”,如今迎头赶上:周二发布了迄今为止最具野心的产品,让开源领域的竞争变得白热化。(或者说,这次连钱都不收。)
该系列共4款模型,涵盖了口袋级助手到拥有6750亿参数的尖端系统,全部采用宽松的Apache 2.0开源许可协议。所有模型均可公开下载——任何拥有合适硬件的人都可以在本地运行、修改、微调,或基于其开发应用。
旗舰产品Mistral Large 3采用稀疏混合专家(Mixture-of-Experts)架构,每个token只激活6750亿总参数中的410亿。这一工程选择让它拥有前沿性能的同时,推理时的算力需求更接近于一个400亿参数模型。
Mistral Large 3完全从零开始训练,使用了3000块NVIDIA H200 GPU,并在LMArena排行榜上成为开源非推理模型中的第二名。
与DeepSeek的基准竞争呈现出复杂的局面。根据Mistral的基准测试,其最佳模型在多个指标上超过了DeepSeek V3.1,但在LMArena上被更新的V3.2略微甩开几分。
在通用知识和专家推理任务上,Mistral系列表现不俗。DeepSeek领先的地方在于编码速度和数学逻辑能力。但这是意料之中的:此次发布不包含推理模型,因此这些模型架构中没有嵌入“思维链”。
更小的“Ministral”模型则为开发者带来了新鲜感。三种尺寸——3B、8B和14B参数——均提供基础版和指令微调版。全部原生支持视觉输入。3B模型吸引了AI研究员Simon Willison的注意,他指出该模型可通过WebGPU完全在浏览器中运行。
如果你想尝试,可以在这个Huggingface空间本地加载它,并通过摄像头交互输入。
一个具备视觉能力、仅约3GB文件大小的AI,为追求高效的开发者甚至业余爱好者打开了新的可能性:无人机、机器人、离线运行的笔记本、车载嵌入式系统等。
早期测试显示该系列模型表现各异。在快速测试中,我们发现Mistral 3 Large在对话流畅性方面表现出色。有时它的格式风格类似GPT-5,(语言风格和表情符号偏好也相似),但语调更自然。
Mistral 3 Large在内容审查方面也较为宽松,在ChatGPT、Claude或Gemini之间选择快速角色扮演时表现更佳。
在自然语言任务、创意写作和角色扮演方面,用户普遍认为14B指令版表现不错但不算突出。Reddit上r/LocalLLaMA的讨论指出,其存在重复和过度依赖训练数据中模板化短语的问题,但其生成长文本内容的能力对同级别模型来说是加分项。
开发者在本地推理时发现3B和8B模型有时会陷入循环,或在创意任务中输出模式化内容。
不过,3B模型体积小到可以在智能手机等低性能硬件上运行,并可针对特定用途进行训练/微调。目前该细分领域唯一的竞争者是Google Gemma 3的最小版本。
企业级应用已开始推进。汇丰银行周一宣布与Mistral达成多年合作,将在运营中部署生成式AI。该行将在自有基础设施上本地运行模型,结合内部技术能力与Mistral的专业知识。对于需遵循GDPR、处理敏感客户数据的金融机构来说,拥有开源权重且总部位于欧盟的AI供应商极具吸引力。
Mistral与NVIDIA合作推出了NVFP4压缩检查点,使Large 3可在单节点8张旗舰显卡上运行。NVIDIA表示,Ministral 3B在RTX 5090上可达到约385 tokens/s,在机器人专用Jetson Thor上超过50 tokens/s。这意味着该模型推理效率极高,响应更快且不损失质量。
公告称,专为推理优化的Large 3版本即将推出。在此之前,DeepSeek R1及中国的GLM、Qwen Thinking等模型在显式推理任务上仍有差异化。但对于企业来说,如果需要前沿能力、开源权重、覆盖欧洲多语种、且不受中美国家安全法律约束的公司,选择已从零增至一。