黃仁勳 CES 震撼宣告:物理 AI 的 ChatGPT 時刻快到了

Market Whisper

黃仁勳預告物理AI

黃仁勳在 CES 宣告「物理 AI 的 ChatGPT 時刻快到了」。英偉達發布 Vera Rubin 平台算力提升 5 倍,開源 Alpamayo 自動駕駛、Cosmos 世界模型和 Groot 機器人。強調兩次平台遷移同時發生:AI 重做應用、Physical AI 重做現實。

Vera Rubin 硬體革命的三大突破

黃仁勳在 CES 演講開頭就稱,「我們有 15 公斤的內容要塞進今天這場演講裡,會場裡坐著 3,000 人,外面的庭院裡還有 2,000 人在看,四樓還有人在線,全球數百萬人在觀看。」但他很快把話題拉回硬體,宣布 Vera Rubin 已經全面投產。

Vera Rubin 這個名字源自 20 世紀的天文學家,她觀察到星系邊緣的旋轉速度與中心差不多,這按牛頓物理學說不通,除非存在看不見的物質——暗物質。英偉達把下一代運算平台命名為 Vera Rubin,因為他們面臨的「看不見的東西」也在膨脹:運算需求。

黃仁勳描述了算力需求的瘋狂。模型規模每年 10 倍增長,o1 之後推理變成「思考過程」,後訓練引入強化學習計算量暴增;test-time scaling 讓每次推理 token 量再漲 5 倍;而且每次衝到新前沿,上一代 token 成本會以每年 10 倍速度下跌。這反過來說明競爭極其激烈,英偉達必須「每年推進一次計算的 state-of-the-art,一年都不能落下」。

Vera Rubin 的六芯協同架構

定制 CPU Vera:性能翻倍,與 Rubin GPU 從一開始就雙向一致性共享數據

Rubin GPU:一塊計算板可達 100 PFLOPS 的 AI 算力,是上一代 5 倍

網路與安全:ConnectX-9 提供 1.6 Tbps 橫向頻寬,BlueField-4 DPU 卸載儲存與安全

一塊計算板上有 17,000 個組件,運算托盤被重新設計到「沒有線、沒有水管、沒有風扇」的型態。第六代 NVLink 交換把 18 個節點連成一體,再擴充到 200G、共封裝光學,把成千上萬機櫃組成「AI 工廠」。在 10 兆參數、100 兆 token 訓練任務裡,Rubin 只需要 Blackwell 四分之一的系統規模就能在同樣一個月窗口裡訓練完畢。

黃仁勳也提到現實的產業難題。英偉達內部原本有規則,新一代產品最多換一兩個晶片,別把供應鏈折騰死。可摩爾定律放緩後,電晶體成長跟不上模型 10 倍、token 5 倍、成本 10 倍下滑的速度,不做「co-design(協同設計)」就不可能追上,所以這一代不得不把每一顆晶片都重新設計。Rubin GPU 浮點效能是 Blackwell 的 5 倍,但電晶體只有 1.6 倍,這意味著單靠製程堆電晶體已經到天花板,必須靠架構與系統級協同設計才能搞出效能。

開源模型的集體躍遷策略

過去一年,真正讓黃仁勳感到「興奮」的,不是某一家閉源模式的進步,而是開源模式的集體躍遷。黃仁勳稱,開放模型現在離前沿模型大約「落後六個月」,但每過六個月就會冒出更聰明的新模型,所以下載量爆炸,因為創業公司想參與,大公司想參與,研究者想參與,學生想參與,幾乎每個國家都想參與。

很多人誤解英偉達,說它只是「賣 GPU」,而黃仁勳在 CES 台上反覆強調,英偉達正在成為前沿開源模型構建者,而且是完全開放的那種。他一口氣報了一堆英偉達開源模型:從混合 Transformer-SSM 的 Nemotron,世界模型 Cosmos,到人形機器人 Groot。連自動駕駛領域的 Alpamayo,不僅開源模型,還開源訓練資料。

黃仁勳宣布 Alpamayo 是「世界第一個會思考、會推理的自動駕駛 AI」。它端到端從攝影機到執行器,既學了大量真實里程的「人類示範」,也學了 Cosmos 生成的里程,再加上「幾十萬」極其仔細的標註樣本。關鍵是它不只輸出方向盤和煞車油門,還會告訴你它將採取什麼動作、為什麼這樣做、軌跡是什麼。

黃仁勳稱,他們八年前就開始做自動駕駛,是因為很早就判斷深度學習會重做整個運算堆疊。Alpamayo 宣布「今天開源」,這套工程規模巨大,黃仁勳說他們的 AV 團隊「幾千人」,而賓士五年前就與他們合作。他預測未來可能會有 10 億輛車自動駕駛,「每一輛車都會有會思考的能力,每一輛車都會由 AI 驅動」。

物理 AI 的三台電腦架構

黃仁勳花了極長時間講一件事:讓 AI 理解世界的常識,比語言困難得多。物體恆存、因果關係、慣性、摩擦、重力,對人類幼兒來說是直覺,對 AI 來說卻完全陌生。而現實世界的數據永遠不夠。他說要做 physical AI,需要「三台電腦」:訓練模型的、在車/機器人/工廠邊緣推理的、以及用於模擬的。

Omniverse 是數位孿生模擬世界,Cosmos 是世界基礎模型,機器人模型則有 Groot 和 Alpamayo。訓練資料從哪裡來?語言模型有大量文本,物理世界的真實視頻很多,但遠遠不夠覆蓋多樣交互。於是他們用符合物理定律的合成資料生成,選擇性地製造訓練樣本。

Cosmos 能從單張圖生成逼真視頻,從 3D 場景描述生成連貫運動,從感測器日誌生成環視視頻,從場景提示把「邊緣案例」製造出來。還能閉環仿真,動作一做,世界響應,Cosmos 再推理下一步。黃仁勳把自動駕駛定義為 physical AI 的第一個「大規模主流市場」,並斷言「拐點就在現在這段時間」,未來十年世界上很大比例的車會高度自動化。

黃仁勳認為,未來的 AI 不只是多模態,而是「多模型」。最聰明的系統應該在不同任務中呼叫最適合的模型,最真實的系統天然是多雲、混合雲、邊緣運算的。這意味著 AI 應用的本質,其實是一套調度與推理的架構,一個能判斷意圖、選擇模型、呼叫工具、組合結果的智能體。黃仁勳認為,這種智能體正在成為新的「使用者介面」,不再是 Excel,不再是表單,不再是命令列。

輝達這家公司正在經歷一種矛盾的時刻。它看起來像是所有泡沫敘事裡最危險的那一個,市值已經衝到史無前例的高度。但它同時像所有 AI 概念股裡最強的那一個,一個季度營收、淨利數百億美元,毛利率能達到 70%。當一家公司同時掌握科技敘事、產業鏈重要位置、以及金融市場注意力時,它就會變成圖騰。圖騰的好處是信仰帶來溢價,壞處是溢價意味著你不能犯錯。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论