Fonte da imagem: Financial Times
Nos últimos dois anos, o principal foco competitivo da indústria de inteligência artificial centrou-se no “treino”—a corrida para construir os modelos de grande escala mais poderosos. A evolução constante do GPT-4 para arquiteturas multimodais tem-se concentrado em ultrapassar os limites das capacidades dos modelos.
Contudo, na NVIDIA GTC 2026, Jensen Huang foi taxativo: o centro da atividade da IA está a deslocar-se do treino para a inferência.
Esta transformação traduz uma nova dinâmica de negócio: o treino representa um investimento único, enquanto a inferência gera procura contínua.
Em concreto:
Assim, a IA está a passar de uma indústria orientada pela tecnologia para uma indústria orientada pela procura, mudando de despesas de capital (CapEx) para receitas recorrentes.
A expressão “os data centers são fábricas de Token” não é mero marketing—representa um novo paradigma industrial. Na era tradicional da internet:
Na era da IA, esta lógica é profundamente alterada:
Esta mudança confere aos data centers, pela primeira vez, o estatuto de unidades de produção.
Surge um ciclo fechado: investimento em computação → computação de inferência → geração de Token → realização de rendimento
Neste contexto, o conceito “AI Factory” da NVIDIA redefine a infraestrutura de IA com base em princípios industriais:
Ou seja, os data centers passaram de clusters de servidores a “centrais elétricas” ou “instalações de fabrico”.
A função de produção na era da IA pode ser expressa assim:

Rendimento = Tokens × Preço, Custo = Custo de computação
O lucro reduz-se a Lucro = Tokens × (Preço - Custo por Token)
Este modelo impulsiona três mudanças principais:
O aumento previsto da procura de inferência resulta de três mudanças estruturais:
Da simples geração ao raciocínio complexo:
Cada invocação acarreta agora custos computacionais muito superiores.
A IA está a evoluir do processamento de textos curtos para:
Isto eleva drasticamente as necessidades de computação.
Os Agents de IA podem:
A procura de computação na IA passa assim de um crescimento linear para exponencial.
Na NVIDIA GTC 2026, a NVIDIA apresentou implicitamente um modelo de serviços de IA estratificados, ou seja, uma tarifação escalonada dos recursos de computação.
Este sistema segue a lógica em camadas da computação em nuvem:
Cenários distintos implicam preços de Token diferenciados:
No fim, o fator decisivo é: quem consegue produzir Tokens ao menor custo e vender ao preço mais elevado.
Jensen Huang estima que, até 2027, o mercado de chips e infraestrutura de IA possa atingir 1 bilião de dólares.
A principal conclusão é que a IA está a tornar-se infraestrutura—equiparada a:
Esta tendência originará três grandes mudanças:
O capital migrará da camada de aplicações para a infraestrutura de base:
Novos protagonistas centrais serão:
A IA deixou de ser apenas uma questão de software—passou a envolver:
Se os Tokens são produtos, os Agents são os “geradores de procura”. Na internet tradicional, a procura era criada pelos utilizadores; na era da IA:
Os próprios Agents geram procura. Exemplos:
Isto representa o surgimento das primeiras entidades não humanas a criar procura na economia da IA. Assim, a dimensão dos Agents define o limite superior da procura de inferência.
Por isso, a competição em IA está a deslocar-se rapidamente para:
Apesar do apelo da narrativa “Token Factory”, persistem preocupações significativas no mercado.
Se o preço dos Tokens cair, as margens de lucro serão comprimidas.
Muitas aplicações de IA mantêm-se em fase experimental.
Estes fatores podem pôr em causa a estabilidade de longo prazo da economia dos Tokens.
Ao abstrair a tendência atual, surge uma analogia central:
Esta estrutura aproxima-se dos sistemas de produção industrial da Revolução Industrial. Indica a transição da IA de uma indústria de software para um sistema industrial orientado pela computação.
Na NVIDIA GTC 2026, o conceito “Token Factory” de Jensen Huang não é apenas uma metáfora—redefine a lógica essencial da indústria da IA:
Com a ascensão da economia dos Agents e o crescimento exponencial da procura de inferência, o mercado de infraestrutura de IA está a caminho de atingir a escala dos biliões de dólares.
Se a tendência se mantiver, a competição empresarial do futuro deixará de depender de produtos ou número de utilizadores—e passará a centrar-se em quem consegue produzir Tokens com maior eficiência.





