Fuente de la imagen: Financial Times
En los dos últimos años, la competencia en la industria de la IA se ha centrado fundamentalmente en el “entrenamiento”: la carrera por desarrollar los modelos a gran escala más potentes. La evolución constante desde GPT-4 hasta arquitecturas multimodales ha estado dirigida a ampliar los límites de las capacidades de los modelos.
Sin embargo, en NVIDIA GTC 2026, Jensen Huang dejó claro que el foco principal de la IA está pasando del entrenamiento a la inferencia.
Este cambio refleja una nueva dinámica de negocio: el entrenamiento es una inversión puntual, mientras que la inferencia genera demanda de manera continua.
Concretamente:
Como consecuencia, la IA está pasando de ser una industria impulsada por la tecnología a una guiada por la demanda, cambiando los gastos de capital (CapEx) por ingresos recurrentes.
La afirmación de que “los centros de datos son fábricas de Tokens” va más allá del marketing: supone un nuevo paradigma industrial. En la era tradicional de internet:
En la era de la IA, esta lógica se transforma por completo:
Por primera vez, los centros de datos adquieren las características de unidades de producción.
Surge así un ciclo cerrado: inversión en computación → inferencia → generación de Tokens → materialización de ingresos
En este contexto, el concepto de “AI Factory” de NVIDIA redefine la infraestructura de IA bajo principios industriales:
En otras palabras, los centros de datos han evolucionado de ser clústeres de servidores a convertirse en “centrales eléctricas” o “plantas de fabricación”.
La función de producción en la era de la IA se puede expresar así:

Ingresos = Tokens × Precio, Coste = Coste de computación
Por tanto, el beneficio se reduce a Beneficio = Tokens × (Precio - Coste por Token)
Este modelo impulsa tres transformaciones clave:
El esperado auge en la demanda de inferencia se debe a tres transformaciones estructurales:
De la generación básica al razonamiento complejo:
Cada invocación requiere ahora mucho más cómputo.
La IA está pasando del procesamiento de textos breves a:
Esto multiplica las necesidades computacionales.
Los Agentes de IA pueden:
Como consecuencia, la demanda de computación de la IA pasa de un crecimiento lineal a uno exponencial.
En NVIDIA GTC 2026, NVIDIA también introdujo implícitamente un modelo estratificado de servicios de IA, es decir, precios escalonados para los recursos de computación.
Este sistema se asemeja al enfoque por capas de la computación en la nube:
Cada escenario exige un precio de Token diferente:
En definitiva, la clave está en: Quién puede producir Tokens al menor coste y venderlos al mayor precio.
Jensen Huang estima que para 2027 el mercado de chips e infraestructura de IA podría alcanzar 1 billón de dólares.
El mensaje principal es que la IA está convirtiéndose en infraestructura, al nivel de:
Esta tendencia impulsará tres grandes cambios:
El capital migrará de la capa de aplicaciones a la infraestructura fundamental:
Los nuevos protagonistas serán:
La IA deja de ser solo una cuestión de software y pasa a involucrar:
Si los Tokens son productos, los Agentes son los “generadores de demanda”. En el internet tradicional, los usuarios generaban la demanda; en la era de la IA:
Los propios Agentes generan la demanda. Por ejemplo:
Esto supone la aparición, por primera vez, de entidades no humanas generadoras de demanda en la economía de la IA. Así, la escala de los Agentes marca el límite máximo de la demanda de inferencia.
Por este motivo, la competencia en IA se está desplazando rápidamente hacia:
Aunque la narrativa de la “fábrica de Tokens” resulta atractiva, subsisten importantes dudas en el mercado.
Si el precio de los Tokens cae, los márgenes se reducen.
Muchas aplicaciones de IA siguen en fase experimental.
Estos factores pueden poner en entredicho la estabilidad a largo plazo de la economía de los Tokens.
Si analizamos la tendencia actual, la analogía es clara:
Esta estructura es muy similar a los sistemas de producción industrial de la Revolución Industrial. Señala la transición de la IA de una industria de software a un sistema industrial basado en la computación.
En NVIDIA GTC 2026, el concepto de “fábrica de Tokens” de Jensen Huang no es solo una metáfora: redefine la lógica esencial de la industria de la IA:
Con el auge de la economía de los Agentes y la creciente demanda de inferencia, el mercado de infraestructura de IA se encamina hacia una escala de billones de dólares.
Si la tendencia continúa, la competencia empresarial del futuro será menos sobre productos o usuarios, y más sobre quién puede producir Tokens con mayor eficiencia.





