Fonte da imagem: Financial Times
Nos últimos dois anos, o grande foco competitivo da indústria de IA esteve no “treinamento” — a corrida para criar os modelos de larga escala mais poderosos. A evolução constante do GPT-4 para arquiteturas multimodais concentrou-se em ampliar o potencial dos modelos.
Porém, na NVIDIA GTC 2026, Jensen Huang deixou claro: o centro estratégico da IA está migrando do Treinamento para a Inferência.
Essa mudança reflete uma nova dinâmica empresarial: o treinamento é um investimento único, enquanto a inferência gera demanda contínua.
Em resumo:
Com isso, a IA deixa de ser um setor movido apenas por tecnologia para se tornar um mercado orientado pela demanda, migrando de despesas de capital (CapEx) para receita recorrente.
A afirmação de que “data centers são fábricas de Tokens” vai além do marketing — ela inaugura um novo paradigma industrial. Na era clássica da internet:
Na era da IA, essa lógica foi completamente transformada:
Essa mudança faz com que, pela primeira vez, data centers assumam o papel de unidades de produção.
Surge um ciclo fechado: Investimento em computação → Inferência → Geração de Token → Realização de receita
Dentro desse cenário, o conceito “AI Factory” da NVIDIA redefine a infraestrutura de IA sob a ótica industrial:
Em outras palavras, data centers evoluíram de clusters de servidores para “usinas” ou “fábricas digitais”.
A função de produção na era da IA pode ser representada por:

Receita = Tokens × Preço, Custo = Custo computacional
Portanto, o lucro se resume a Lucro = Tokens × (Preço - Custo por Token)
Esse modelo impulsiona três mudanças essenciais:
O salto esperado na demanda por inferência decorre de três mudanças estruturais:
De geração simples para raciocínio avançado:
Cada chamada agora implica custos computacionais muito maiores.
A IA está saindo do processamento de textos curtos para:
Isso aumenta drasticamente a demanda computacional.
Agents de IA podem:
Assim, a demanda por computação da IA passa de um crescimento linear para exponencial.
Na NVIDIA GTC 2026, a NVIDIA também apresentou, de forma implícita, um modelo escalonado de serviços de IA — ou seja, preços diferenciados para recursos computacionais.
Esse sistema se assemelha ao modelo de camadas da computação em nuvem:
Cenários distintos justificam preços de Token diferentes:
No fim, o fator decisivo é: quem consegue produzir Tokens ao menor custo e vender ao maior preço.
Jensen Huang prevê que, até 2027, o mercado de chips e infraestrutura de IA pode atingir US$ 1 trilhão.
A grande conclusão é que a IA está se tornando infraestrutura — equiparada a:
Esse movimento trará três mudanças principais:
O capital vai migrar da camada de aplicações para a infraestrutura central:
Novos protagonistas centrais serão:
A IA deixou de ser apenas um tema de software — agora envolve:
Se Tokens são produtos, Agents são os “geradores de demanda”. Na internet tradicional, os usuários criavam demanda; na era da IA:
Os próprios Agents geram demanda. Exemplos:
Pela primeira vez, surgem entidades não humanas como geradoras de demanda na economia de IA. Ou seja, a escala dos Agents define o teto da demanda por inferência.
Por isso, a competição em IA está migrando rapidamente para:
Apesar de a narrativa de “Token Factory” ser convincente, há preocupações relevantes no mercado.
Se o preço dos Tokens cair, as margens de lucro serão pressionadas.
Muitas aplicações de IA ainda estão em fase experimental.
Esses fatores podem comprometer a estabilidade de longo prazo da economia de Tokens.
Ao abstrair a tendência atual, surge uma analogia fundamental:
Essa estrutura é muito semelhante aos sistemas industriais da Revolução Industrial. Isso sinaliza a transição da IA de uma indústria de software para um sistema industrial movido por computação.
Na NVIDIA GTC 2026, o conceito de “Token Factory” apresentado por Jensen Huang não é apenas uma metáfora — ele redefine a lógica fundamental do setor de IA:
Com o avanço da economia dos Agents e o crescimento explosivo da demanda por inferência, o mercado de infraestrutura de IA caminha para a casa dos trilhões de dólares.
Se essa tendência se mantiver, a competição empresarial do futuro será menos sobre produtos ou número de usuários — e mais sobre quem produz Tokens com máxima eficiência.





