前不久,NVIDIA 在推理市場上完成了一個有趣的佈局。它以 2000 億美元收購了 Groq 的晶片業務,並帶來了由 Jonathan Ross 領導的核心團隊。令人好奇的是,Groq 仍以獨立公司身份運作,並非完全被併入。



讓我注意到的是 Huang Renxun 關於為何這樣做的解釋。結果發現,推理市場並非單一體系。以前,一切都圍繞著提升性能,僅此而已。但現在情況改變了。用戶願意根據反應速度支付不同的價格。如果工程師能更快處理代幣並提高生產力,他們就願意投資。

這就是 Groq 發揮作用的地方。它的 LPU 架構以低確定性延遲著稱,與 NVIDIA 高性能 GPU 的做法截然不同。就像是在完成一個光譜:一端是最大性能,另一端是最高反應速度。市場的兩個細分,兩個不同的價格,同一個模型。

在三月的 GTC 會議上,他們推出了搭載三星 4 奈米製程的 Groq 3 LPU。數據令人印象深刻:在每毫瓦推理效率方面,比 Blackwell NVL72 高出 35 倍。這種差異化策略開啟了新的市場,而非僅在現有市場中競爭。

Groq 的策略很明確:當 NVIDIA 主導高性能時,他們專注於滿足那些重視速度的用戶需求。兩種策略,打造更完整的生態系。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆