黄仁勋 CES 震撼宣告:物理 AI の ChatGPT 時刻が近づいている

黃仁勳預告物理AI

黄仁勳はCESで「物理AIのChatGPTの瞬間が近づいている」と宣言した。英偉達はVera Rubinプラットフォームの計算能力を5倍向上させ、オープンソースのAlpamayo自動運転、Cosmos世界モデル、Grootロボットを発表した。プラットフォームの移行が2回同時に起こったことを強調:AIの再構築応用と、Physical AIによる現実の再構築。

Vera Rubinハードウェア革命の三大突破

黄仁勳はCESの冒頭で、「私たちは15キロの内容を今日の講演に詰め込む必要があり、会場には3000人、外の庭には2000人、4階にはオンラインで数百万人が視聴している」と述べた。しかしすぐに話題をハードウェアに戻し、Vera Rubinが全面的に量産開始されたことを発表した。

Vera Rubinという名前は20世紀の天文学者に由来し、彼女は銀河の端の回転速度が中心とほぼ同じであることを観察した。これはニュートン物理学では説明できず、見えない物質——ダークマターの存在を示唆している。英偉達は次世代計算プラットフォームをVera Rubinと命名した。彼らが直面している「見えないもの」も膨張している:計算需要。

黄仁勳は計算能力の狂乱的な需要を描写した。モデル規模は毎年10倍増加し、o1以降推論は「思考過程」へと進化、後訓練には強化学習が導入され計算量が爆発的に増加;test-time scalingにより推論トークン数はさらに5倍に増加;そして新たなフロンティアに到達するたびに、前世代のトークンコストは毎年10倍の速度で下落している。これが競争の激しさを示し、英偉達は「毎年最先端の計算を推進し続けなければならない」と語った。

Vera Rubinの六芯協調アーキテクチャ

カスタムCPU Vera:性能が倍増し、Rubin GPUと最初から双方向の一貫性を持ちデータを共有

Rubin GPU:1枚の計算基板で100 PFLOPSのAI計算能力を持ち、前世代の5倍

ネットワークとセキュリティ:ConnectX-9は1.6 Tbpsの横方向帯域幅を提供し、BlueField-4 DPUはストレージとセキュリティをオフロード

1枚の計算基板には17,000個のコンポーネントが搭載され、計算トレイは「ケーブル、水道管、ファンのない」形態に再設計された。第6世代NVLinkスイッチングにより18ノードが一体化し、さらに200Gの光学封装に拡張され、何千何万ものキャビネットを「AI工場」に組み立てる。10兆パラメータ、100兆トークンの訓練タスクにおいて、RubinはBlackwellの4分の1のシステム規模で同じ月内に訓練を完了できる。

黄仁勳はまた、現実の産業界の課題にも言及した。英偉達内部には規則があり、新世代の製品は最大でも1〜2つのチップを交換し、サプライチェーンを荒らさないようにしていた。しかし、ムーアの法則の緩慢化により、トランジスタの成長はモデルの10倍、トークンの5倍、コストの10倍の低下速度に追いつかなくなった。コ・デザイン(協同設計)を行わなければ追いつけないため、この世代ではすべてのチップを再設計せざるを得なかった。Rubin GPUの浮動小数点性能はBlackwellの5倍だが、トランジスタは1.6倍しかなく、これは製造プロセスの天井に到達しており、性能向上にはアーキテクチャとシステムレベルの協同設計が必要となる。

オープンソースモデルの集団飛躍戦略

過去1年、黄仁勳が「興奮」したのは、特定のクローズドソースモデルの進歩ではなく、オープンソースモデルの集団的飛躍だった。黄仁勳は、オープンモデルは現在最先端モデルから約「6ヶ月遅れている」と述べたが、6ヶ月ごとにより賢い新モデルが登場し、ダウンロード数は爆発的に増加している。スタートアップは参加したい、大企業も参加したい、研究者も学生も参加したい、ほぼすべての国が関心を持っている。

多くの人は英偉達を誤解している。彼らは単に「GPUを売る会社」と思っているが、黄仁勳はCESで繰り返し強調した。英偉達は最先端のオープンソースモデルの構築者になりつつあり、それは完全にオープンなものであると。彼は一気にいくつもの英偉達のオープンソースモデルを紹介した:Transformer-SSMのNemotron、世界モデルのCosmos、人型ロボットのGroot。自動運転分野のAlpamayoも、モデルだけでなく訓練データもオープンソース化している。

黄仁勳は、Alpamayoは「世界初の思考・推論できる自動運転AI」と宣言した。エンドツーエンドでカメラから実行装置まで、実車の「人間の模範」だけでなく、Cosmos生成の走行データも学習し、「数十万」の非常に詳細なラベル付けサンプルも含む。重要なのは、ハンドルやブレーキ・アクセルだけを出力するのではなく、どのような動作を取るか、その理由、軌跡まで伝えることだ。

黄仁勳は、彼らが8年前に自動運転に取り組み始めたのは、深層学習が計算スタックを再構築すると早期に判断したからだと述べた。Alpamayoは「今日オープンソース化」され、このプロジェクトは巨大で、彼らのAVチームは「数千人規模」と語る。一方、メルセデス・ベンツは5年前に彼らと協力していた。将来的には10億台の車が自動運転を実現し、「すべての車に思考能力が備わり、AIによって駆動される」と予測している。

物理AIの三台コンピュータアーキテクチャ

黄仁勳は長い時間をかけて一つのことを語った。それは、AIに世界の常識を理解させることは、言語よりもはるかに難しいということだ。物体の保存、因果関係、慣性、摩擦、重力は人間の幼児には直感的だが、AIにとってはまったく未知の領域である。そして現実世界のデータは常に不足している。彼は、physical AIを作るには「三台のコンピュータ」が必要だと述べた:モデルを訓練するためのもの、車やロボット、工場のエッジで推論を行うもの、そしてシミュレーション用のもの。

Omniverseはデジタルツインのシミュレーション世界、Cosmosは世界基盤モデル、ロボットモデルにはGrootとAlpamayoがある。訓練データはどこから来るのか?言語モデルには大量のテキストがあるが、物理世界のリアルな映像は多いものの、多様なインタラクションを十分にカバーできていない。そこで彼らは、物理法則に則った合成データ生成を用いて、選択的に訓練サンプルを作り出している。

Cosmosは単一の画像からリアルな動画を生成し、3Dシーンの記述から連続した動きを作り出し、センサーログからパノラマ映像を生成し、シーンのプロンプトから「エッジケース」を作り出すこともできる。さらに閉ループのシミュレーションも可能で、動作を行えば世界が反応し、Cosmosは次の一歩を推論する。黄仁勳は、自動運転を「物理AIの最初の大規模な主流市場」と定義し、「今が転換点だ」と断言した。今後10年で、多くの車が高度に自動化されると予測している。

黄仁勳は、未来のAIは単なるマルチモーダルではなく、「マルチモデル」になると考えている。最も賢いシステムは、異なるタスクに最適なモデルを呼び出すべきであり、最もリアルなシステムは自然にマルチクラウド、ハイブリッドクラウド、エッジコンピューティングを組み合わせたものになる。これは、AIアプリケーションの本質が、意図を判断し、モデルを選び、ツールを呼び出し、結果を組み合わせる「スケジューリングと推論のアーキテクチャ」に他ならないことを意味している。黄仁勳は、この種のインテリジェントエージェントが新しい「ユーザーインターフェース」になりつつあると考えている。もはやExcelやフォーム、コマンドラインではない。

NVIDIAは、矛盾に満ちた時代を迎えているように見える。市場価値は史上最高の高騰を見せているが、同時に最も危険なバブルの一つとも見なされている。しかし、同時に最も強力なAI関連株の一つでもあり、四半期の売上高と純利益は数百億ドル、粗利率は70%に達している。ある企業が技術の物語、産業の重要な位置、そして金融市場の注目を同時に掌握しているとき、それはまるで神格化された存在となる。神格化の利点は信仰によるプレミアムをもたらすことだが、欠点はそのプレミアムが誤りを犯せないことを意味している。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン