Source de l’image : Financial Times
Au cours des deux dernières années, la compétition dans l’industrie de l’IA s’est principalement concentrée sur « l’entraînement » : la course à la création des modèles à grande échelle les plus performants. L’évolution continue, de GPT-4 vers des architectures multimodales, a mis l’accent sur le dépassement des limites des modèles.
Pourtant, lors du NVIDIA GTC 2026, Jensen Huang a affirmé que le centre de gravité de l’IA se déplace de l’entraînement vers l’inférence.
Cette évolution traduit une nouvelle dynamique économique : l’entraînement est un investissement unique, tandis que l’inférence génère une demande continue.
Concrètement :
L’IA passe ainsi d’un modèle technologique à un modèle guidé par la demande, évoluant des dépenses d’investissement (CapEx) vers des revenus récurrents.
Dire que « les data centers sont des Token factories » n’est pas qu’un slogan — cela marque un nouveau paradigme industriel. À l’ère Internet traditionnelle :
À l’ère de l’IA, cette logique est profondément remaniée :
Pour la première fois, les data centers acquièrent les caractéristiques d’unités de production.
Un cycle fermé se dessine : investissement en calcul → inférence → génération de Tokens → réalisation de revenus
Dans ce contexte, le concept « AI Factory » de NVIDIA redéfinit l’infrastructure IA sur des principes industriels :
Autrement dit, les data centers sont passés de clusters de serveurs à de véritables « centrales » ou « usines ».
La fonction de production à l’ère de l’IA se formule ainsi :

Revenu = Tokens × Prix, Coût = coût de calcul
Le profit devient donc Profit = Tokens × (Prix - Coût par Token)
Ce modèle entraîne trois mutations majeures :
L’explosion attendue de la demande d’inférence découle de trois évolutions structurelles :
De la génération basique au raisonnement complexe :
Chaque appel de modèle implique désormais des coûts de calcul nettement plus élevés.
L’IA passe du traitement de courts textes à :
Les besoins en calcul augmentent considérablement.
Les Agents IA peuvent :
Ainsi, la demande de calcul de l’IA évolue d’une croissance linéaire à exponentielle.
Lors du NVIDIA GTC 2026, NVIDIA a également introduit implicitement un modèle stratifié de services IA, soit une tarification différenciée des ressources de calcul.
Ce système s’inspire de l’approche par couches du cloud computing :
Les scénarios d’usage déterminent le prix des Tokens :
Au final, le critère décisif est : produire des Tokens au coût le plus bas et vendre au prix le plus élevé.
Jensen Huang prévoit qu’en 2027, le marché des puces IA et de l’infrastructure pourrait atteindre 1 trillion de dollars.
L’essentiel à retenir : l’IA devient une infrastructure — au même titre que :
Cette tendance induit trois changements majeurs :
Les capitaux se déplacent de la couche applicative vers l’infrastructure fondamentale :
De nouveaux acteurs centraux émergent :
L’IA n’est plus seulement une question logicielle — elle implique désormais :
Si les Tokens sont des produits, les Agents sont les « générateurs de demande ». Dans l’Internet traditionnel, les utilisateurs créaient la demande ; à l’ère de l’IA :
Les Agents génèrent eux-mêmes la demande. Par exemple :
C’est la première fois que des entités non humaines génèrent la demande dans l’économie IA. Ainsi, la taille de l’écosystème d’Agents fixe la limite supérieure de la demande d’inférence.
C’est pourquoi la compétition IA se déplace rapidement vers :
Bien que le narratif « Token Factory » soit séduisant, des préoccupations majeures subsistent.
Si les prix des Tokens baissent, les marges bénéficiaires seront réduites.
De nombreuses applications IA restent expérimentales.
Ces facteurs pourraient fragiliser la stabilité à long terme de l’économie des Tokens.
L’analyse de la tendance actuelle révèle une analogie structurante :
Cette configuration rappelle les systèmes industriels de la Révolution industrielle. Elle marque la transition de l’IA d’une industrie logicielle à un système industriel piloté par le calcul.
Au NVIDIA GTC 2026, le concept « Token Factory » de Jensen Huang ne relève pas seulement de la métaphore — il redéfinit la logique fondamentale de l’industrie IA :
Avec l’essor de l’économie des Agents et la demande d’inférence en forte croissance, le marché de l’infrastructure IA s’oriente vers une échelle de trillion de dollars.
Si cette dynamique se confirme, la compétition ne portera plus sur les produits ou le nombre d’utilisateurs, mais sur l’efficacité dans la production de Tokens.





