Nguồn ảnh: Financial Times
Trong hai năm gần đây, trọng tâm cạnh tranh của ngành AI là “huấn luyện” — cuộc đua xây dựng các mô hình quy mô lớn mạnh nhất. Sự phát triển liên tục từ GPT-4 đến các kiến trúc đa phương thức đều xoay quanh việc nâng cao năng lực mô hình.
Tuy nhiên, tại NVIDIA GTC 2026, Jensen Huang đã khẳng định: trọng tâm của AI đang chuyển từ Huấn luyện sang Suy luận (Inference).
Sự chuyển dịch này phản ánh một động lực kinh doanh mới: huấn luyện là khoản đầu tư một lần, trong khi suy luận tạo ra nhu cầu liên tục.
Cụ thể:
Kết quả là, AI đang phát triển từ ngành dựa trên công nghệ sang ngành dựa trên nhu cầu, chuyển dịch từ chi phí đầu tư (CapEx) sang doanh thu định kỳ.
Nhận định “trung tâm dữ liệu là nhà máy Token” không chỉ là khẩu hiệu tiếp thị — mà còn đánh dấu một mô hình công nghiệp mới. Trong kỷ nguyên internet truyền thống:
Trong kỷ nguyên AI, logic này thay đổi hoàn toàn:
Sự chuyển dịch này lần đầu tiên mang lại cho trung tâm dữ liệu đặc điểm của một đơn vị sản xuất.
Một vòng tuần hoàn khép kín xuất hiện: Đầu tư tính toán → Suy luận → Sinh Token → Hiện thực hóa doanh thu
Trong mô hình này, khái niệm “AI Factory” của NVIDIA định nghĩa lại hạ tầng AI theo nguyên lý công nghiệp:
Nói cách khác, trung tâm dữ liệu đã phát triển từ các cụm máy chủ thành “nhà máy điện” hoặc “cơ sở sản xuất”.
Hàm sản xuất trong kỷ nguyên AI được biểu diễn như sau:

Doanh thu = Token × Giá, Chi phí = Chi phí tính toán
Như vậy, lợi nhuận đơn giản hóa thành Lợi nhuận = Token × (Giá - Chi phí trên mỗi Token)
Mô hình này dẫn đến ba chuyển dịch lớn:
Nhu cầu suy luận dự kiến tăng mạnh do ba thay đổi cấu trúc:
Từ sinh nội dung đơn giản đến suy luận phức tạp:
Mỗi lần gọi mô hình hiện nay tiêu tốn chi phí tính toán cao hơn nhiều.
AI đang chuyển từ xử lý văn bản ngắn sang:
Điều này làm tăng đáng kể nhu cầu tính toán.
AI Agent có thể:
Kết quả là, nhu cầu tính toán của AI dịch chuyển từ tăng tuyến tính sang tăng theo cấp số nhân.
Tại NVIDIA GTC 2026, NVIDIA cũng ngầm giới thiệu mô hình dịch vụ AI phân tầng, tức là định giá theo cấp cho tài nguyên tính toán.
Mô hình này tương tự cách tiếp cận phân lớp của điện toán đám mây:
Mỗi kịch bản tương ứng với mức giá Token khác nhau:
Cuối cùng, yếu tố quyết định là: Ai sản xuất Token với chi phí thấp nhất và bán được với giá cao nhất.
Jensen Huang dự báo đến năm 2027, thị trường chip AI và hạ tầng có thể đạt 1 nghìn tỷ USD.
Thông điệp cốt lõi là AI đang trở thành hạ tầng — ngang hàng với:
Xu hướng này sẽ dẫn đến ba thay đổi lớn:
Dòng vốn sẽ chuyển từ tầng ứng dụng về lại hạ tầng cốt lõi:
Các chủ thể trung tâm mới sẽ bao gồm:
AI không còn chỉ là vấn đề phần mềm — mà còn liên quan đến:
Nếu Token là sản phẩm, thì Agent là “bộ tạo nhu cầu”. Trong internet truyền thống, người dùng tạo ra nhu cầu; còn trong kỷ nguyên AI:
Chính Agent tạo ra nhu cầu. Ví dụ:
Đây là lần đầu tiên xuất hiện chủ thể tạo nhu cầu phi con người trong kinh tế AI. Do đó, quy mô Agent xác lập giới hạn trên cho nhu cầu suy luận.
Đó là lý do cuộc đua AI đang nhanh chóng chuyển sang:
Dù câu chuyện “Nhà máy Token” rất hấp dẫn, nhưng vẫn còn nhiều lo ngại trên thị trường.
Nếu giá Token giảm, biên lợi nhuận sẽ bị thu hẹp.
Nhiều ứng dụng AI vẫn chỉ ở giai đoạn thử nghiệm.
Những yếu tố này có thể làm lung lay tính ổn định lâu dài của nền kinh tế Token.
Phân tích xu hướng hiện tại cho thấy một phép so sánh then chốt:
Cấu trúc này rất giống với hệ thống sản xuất công nghiệp thời Cách mạng Công nghiệp. Điều này báo hiệu AI đang chuyển từ ngành phần mềm sang hệ thống công nghiệp dựa trên tính toán.
Tại NVIDIA GTC 2026, khái niệm “Nhà máy Token” của Jensen Huang không chỉ là phép ẩn dụ — mà còn định nghĩa lại logic nền tảng của ngành AI:
Với sự trỗi dậy của nền kinh tế Agent và nhu cầu suy luận tăng mạnh, thị trường hạ tầng AI đang trên đà đạt quy mô nghìn tỷ USD.
Nếu xu hướng này tiếp tục, cạnh tranh kinh doanh trong tương lai sẽ không còn xoay quanh sản phẩm hay số lượng người dùng — mà sẽ là ai sản xuất Token hiệu quả nhất.





