# Huang Ren-Xun GTC2026 Vollständige Rede: KI-Nachfrage erreicht Billionen Dollar, Rechenleistung springt um 350-fach, OpenClaw verwandelt jedes Unternehmen in AaaS

動區BlockTempo

2026-03-17 06:02:42

FET12,38%

NVIDIA-CEO Jensen Huang kündigte auf GTC 2026 an, dass die Nachfrage mindestens 1 Billion US-Dollar bis 2027 erreichen wird, und zeichnete mit Token-Fabrik, CUDA-Feder, Vera Rubin Monster-System, OpenClaw Intelligenz-Betriebssystem den blauen Plan für NVIDIAs nächstes Jahrzehnt.

(Vorheriger Kontext: Huang auf GTC: „DLSS 5, NemoClaw“ entfacht KI-Token: FET steigt um 20 %, NEAR, Worldcoin erreichen neue Höchststände)

(Hintergrund: Chinas Sicherheitsministerium warnt vor „Hummerzucht“: OpenClaw birgt vier große Sicherheitsrisiken, Ihre Geräte könnten übernommen werden)

Inhaltsverzeichnis

Toggle

Eröffnung: Das 20-jährige CUDA-Feder-Phänomen
Token-Fabrik-Ökonomie: Rechenzentren speichern keine Dateien mehr, sondern produzieren Tokens
Vera Rubin: 350-facher Anstieg in zwei Jahren – das ist kein Moores Gesetz, sondern eine andere Kurve
Der wahre Zweck von Groq-Übernahmen: Schneller machen, teurer machen
DLSS 5: Die Grafikbranche erlebt ihren GPT-Moment
OpenClaw: Das Betriebssystem der Ära der Intelligenz-Agenten
Zukunft mit Token-Budget für jeden Entwickler
Physische KI und Robotermassen
Die nächste Generation: Feynman-Architektur + Weltraum-Datenzentren

Am 16. März 2026 eröffnete NVIDIA auf der GTC-Konferenz, Jensen Huang stand auf der Bühne und sagte eine Worte, die die ganze Halle zum Schweigen brachte: „Letztes Jahr sprach ich von einer Nachfrage mit hoher Zuverlässigkeit von 500 Milliarden Dollar. Jetzt, genau in diesem Moment, sehe ich mindestens 1 Billion Dollar. Und ich bin mir sicher, die tatsächliche Nachfrage ist noch höher.“

Mit dieser Aussage stieg die NVIDIA-Aktie an diesem Tag um über 4,3 %. Doch Huang ging es nicht nur um Zahlen, er erklärte während der gesamten Rede, woher diese Billionen kommen und warum sie noch nicht ausreichen.

Eröffnung: Das 20-jährige CUDA-Feder-Phänomen

Der Ausgangspunkt der Rede ist NVIDIAs Kerngeschäft – CUDA. Dieses Jahr ist das 20-jährige Jubiläum von CUDA, Huang bezeichnet es als „100 % strategische Logik“ von NVIDIA.

Kurz gesagt: CUDA ist die Technologie, die es Entwicklern ermöglicht, auf GPUs zu programmieren. Vor zwanzig Jahren war unklar, ob es Erfolg haben würde, doch NVIDIA setzte den Großteil der Ressourcen des Unternehmens auf das Durchhalten. Rückblickend hat diese Entscheidung eine nahezu unkopierbare Burgmauer geschaffen – Hunderte Millionen CUDA-fähige GPUs weltweit, Zehntausende Open-Source-Projekte, die darauf angewiesen sind, und alle Cloud-Anbieter haben es integriert.

Huang nennt das „Feder“: Große Installationszahlen → Entwickler ziehen an → Entwickler entwickeln neue Algorithmen → Durchbrüche in Algorithmen schaffen neue Märkte → Neue Märkte erweitern die Installationen → Das Feder dreht sich weiter. Noch besser: NVIDIA aktualisiert kontinuierlich die Software-Optimierungen. Die Ampere-Architektur vor sechs Jahren ist in der Cloud-Preislage sogar gestiegen – weil die Anwendungen, die darauf laufen, immer zahlreicher und wertvoller werden.

Token-Fabrik-Ökonomie: Rechenzentren speichern keine Dateien mehr, sondern produzieren Tokens

Dies ist das Kernkonzept von Huang in dieser Rede und die entscheidende Logik hinter der Nachfrage von 1 Billion Dollar.

Kurz gesagt: Früher waren Rechenzentren „Lagerhäuser“, um Dateien und Daten zu speichern; künftig sind sie „Fabriken“, um die Grundeinheit der KI zu produzieren – Tokens (die kleinste Einheit, in der KI denkt und spricht).

Huang erklärt: Jedes Rechenzentrum ist durch die Stromversorgung begrenzt. Ein 1-Gigawatt-Fabrik (GW) wird niemals zu 2 GW. Das ist Physik. Das zentrale Wettbewerbsproblem ist also: Mit derselben Energie, wer produziert die meisten Tokens? Wer pro Watt die höchste Token-Durchsatzrate hat, gewinnt.

Tokens werden auch gestaffelt bepreist, ähnlich Business Class und Economy:

Gratis-Schicht (hoher Durchsatz, niedrige Geschwindigkeit)
Mittelklasse (ca. 3 USD pro Million Tokens)
Premium (ca. 6 USD pro Million Tokens)
Hochgeschwindigkeits (ca. 45 USD pro Million Tokens)
Superschnell (ca. 150 USD pro Million Tokens)

Kurz gesagt: Mit derselben GPU sollte man die Leistung auf verschiedene Service-Ebenen aufteilen – je höher Durchsatz und Geschwindigkeit, desto mehr Geld lässt sich verdienen. Huang schätzt, dass das neue System Grace Blackwell im Vergleich zur Vorgänger-Architektur Hopper bei gleicher Leistung das Fünffache an Einnahmen generieren kann.

Vera Rubin: 350-facher Anstieg in zwei Jahren – das ist kein Moores Gesetz, sondern eine andere Kurve

Huang sagt, bei Hopper könne man eine Chip-Probe hochheben; bei Vera Rubin denkt man an das ganze System.

Zahlen sprechen: In einem 1-GW-Rechenzentrum steigt die Token-Generation von 22 Millionen/sec auf 700 Millionen/sec, eine Steigerung um das 350-fache in zwei Jahren. Im Vergleich dazu bringt das Moores Gesetz nur eine 1,5-fache Steigerung.

Wie sieht dieses Monster-System aus? Vera Rubin ist komplett flüssigkeitsgekühlt, eliminiert herkömmliche Kabel, und die Racks, die früher zwei Tage für die Installation brauchten, sind jetzt in zwei Stunden einsatzbereit. Microsoft Azure hat bestätigt, dass die erste Vera Rubin-Installation in Betrieb ist.

Groq-Übernahme: Der wahre Zweck – Schneller machen, teurer machen

NVIDIA integriert Groq-Technologie nicht, um die eigenen GPUs zu ersetzen, sondern für „asymmetrische Inferenz“ – klingt kompliziert, aber einfach gesagt: Die KI-Inferenz wird in zwei Phasen aufgeteilt, für jede Phase das passende Werkzeug.

Groq-Chips verfügen über große, schnelle SRAM (500MB), reagieren extrem schnell, haben aber wenig Speicher – ideal für die letzte Token-Ausgabe. Vera Rubin-Chips haben viel Speicher (288GB) und eignen sich für die Vorberechnung und Caching. NVIDIA verbindet beides mit Dynamo-Software: Das „Pre-Filling“ und die Decodierung der Attention-Mechanismen übernimmt Vera Rubin, die latenzkritische Token-Generierung Groq. Die beiden sind über Ethernet eng gekoppelt, was die Latenz um etwa die Hälfte reduziert.

Huang gibt noch einen Konfigurations-Tipp: Für hohe Durchsatzarbeit 100 % Vera Rubin; bei viel hochpreisiger Code-Generierung etwa 25 % Groq im Rechenzentrum. Die LP30-Chips von Groq werden von Samsung gefertigt, Auslieferung ab Q3 geplant.

DLSS 5: Der GPT-Moment für die Computergrafik

Huang sagt, vor zehn Jahren brachte GeForce KI in die Welt, jetzt wird KI die Computergrafik neu gestalten. Er nennt diese Technik „Neural Rendering“ (Neurales Rendering), also DLSS 5.

Kernidee: Die Kombination aus traditionellen deterministischen 3D-Grafiken (strukturiert, kontrollierbar) und generativer KI (probabilistisch schön) – strukturierte Daten sorgen für Kontrolle, KI macht das Bild schön. Huang sagt, diese „Struktur + generative KI“-Fusion wird in vielen Branchen immer wieder auftauchen.

OpenClaw: Das Betriebssystem der Ära der Intelligenz-Agenten

Peter Steinberger entwickelte OpenClaw, das Huang als „das beliebteste Open-Source-Projekt der Menschheitsgeschichte, das in wenigen Wochen die Leistungen von Linux in dreißig Jahren übertrifft“ bezeichnet.

Was ist OpenClaw? Einfach gesagt: Es ermöglicht KI-Agenten, Ressourcen zu verwalten, Tools aufzurufen, Dateien zu lesen/schreiben, Aufgaben zu planen und große Probleme in kleinere Aufgaben zu zerlegen – ähnlich wie Betriebssysteme Menschenprogramme auf Computern laufen lassen, lassen OpenClaw KI-Agenten in Unternehmen laufen.

Huang sagt: „Jedes SaaS-Unternehmen wird zu einem AaaS-Unternehmen.“ Das heißt, Softwarefirmen verkaufen nicht nur Tools, sondern KI-Agenten-Dienste, die bei der Arbeit helfen.

Aber im Unternehmenseinsatz gibt es Sicherheitsprobleme: Agenten könnten auf sensible Daten zugreifen oder Code ausführen. NVIDIA hat daher NeMo Claw, eine Unternehmensversion, mit Strategiemotor und Privatsphäre-Router vorgestellt, um die sichere Implementierung im Unternehmen zu gewährleisten.

Zukunft mit Token-Budget für jeden Entwickler

Huang prophezeit: „In Zukunft braucht jeder Entwickler in Unternehmen ein jährliches Token-Budget. Ihr Gehalt könnte mehrere Hunderttausend Dollar betragen, und ich gebe ihnen zusätzlich ein Token-Volumen, das die Hälfte ihres Gehalts entspricht, um ihre Produktivität um das Zehnfache zu steigern. Das Token-Budget bei Eintritt ist schon jetzt ein Thema in Silicon Valley.“

Das ist kein Vergleich, sondern eine neue Messgröße für Wettbewerbsfähigkeit: Wie viel Rechenleistung man einem Entwickler gibt, bestimmt, wie viel Wert er schaffen kann. Jedes Unternehmen wird künftig sowohl Token-Verbraucher als auch Token-Produzent sein.

Physische KI und Robotermassen

Huang sagt, digitale Intelligenz bewegt sich in der digitalen Welt, physische KI ist die verkörperte Intelligenz – sprich: Roboter. Auf GTC 2026 wurden 110 Roboter vorgestellt, fast alle führenden Roboterfirmen waren vertreten.

Im autonomen Fahren kündigte Huang an, BYD, Hyundai, Nissan und Geely seien dem NVIDIA RoboTaxi-Programm beigetreten, zusammen produzieren sie jährlich 18 Millionen Fahrzeuge. Mit Mercedes, Toyota und GM ist die Flotte groß. NVIDIA kündigte auch eine Zusammenarbeit mit Uber an, um RoboTaxi-Fahrzeuge in mehreren Städten einzusetzen.

Im Abschluss trat Disney’s Olaf, der Schneemann-Roboter, auf die Bühne, mit Jetson-Chip als Gehirn, lernte laufen im Omniverse und passt sich mit Newton-Physik an die reale Welt an. Huang und Olaf unterhielten sich kurz, Huang schmunzelte: „Ich dachte, du wärst größer. So einen kleinen Schneemann habe ich noch nie gesehen.“

Nächste Generation: Feynman-Architektur + Weltraum-Datenzentren

Am Ende der Rede „leakte“ Huang die nächste Generation der Rechenarchitektur Feynman, die erstmals Kupferleitungen und optische Kopplung (CPO) gleichzeitig horizontal skalieren lässt. Noch weiter gedacht ist „Vera Rubin Space-1“ – ein im All stationiertes Datenzentrum, das KI-Rechenleistung jenseits der Erde ermöglicht.

Huang fasst die wichtigsten Punkte zusammen: Der Inferenz-Wendepunkt ist erreicht, die Ära der KI-Fabriken beginnt, OpenClaw revolutioniert die Agenten, physische KI wird großflächig umgesetzt. Eine Billion Dollar ist nur der Anfang.

Original anzeigen

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Kommentieren

0/400

Keine Kommentare