"R1"的搜索结果
2026-04-17
23:59

DeepSeek-R1发布一周年之际曝光新模型「MODEL1」

DeepSeek在发布新模型「MODEL1」的同时,更新了FlashMLA代码,涉及114个文件中的28个提及此模型,与V32不同。MODEL1可能是新架构,主要差异体现在内存优化、KV缓存布局、稀疏性处理及FP8解码等方面。
展开