"R1"的搜尋結果
2026-04-17
23:59

DeepSeek-R1發布一周年之際曝光新模型「MODEL1」

DeepSeek在發布新模型「MODEL1」的同時,更新了FlashMLA代碼,涉及114個文件中的28個提及此模型,與V32不同。MODEL1可能是新架構,主要差異體現在內存優化、KV緩存佈局、稀疏性處理及FP8解碼等方面。
展開