
Trong diễn đàn Davos, rốt cuộc Huang Renxun đã nói gì?
Có vẻ như ông đang quảng bá robot, nhưng thực ra, ông đang tiến hành một cuộc “cách mạng tự thân” táo bạo. Ông dùng một câu nói để chấm dứt thời đại “chồng card đồ họa” cũ kỹ, nhưng lại vô tình mở ra một tấm vé vào Crypto với cơ hội hiếm có?
Hôm qua, tại diễn đàn Davos, ông Huang chỉ ra rằng tầng ứng dụng AI đang bùng nổ, nhu cầu về sức mạnh tính toán sẽ chuyển từ “huấn luyện” sang “suy luận” và “Physical AI(AI vật lý)”.
Điều này thật sự rất thú vị.
Nvidia, với tư cách là người chiến thắng lớn nhất trong cuộc đua “quân bị sức mạnh tính toán” của thời đại AI 1.0, giờ đây chủ động đề cập đến sự chuyển hướng sang “suy luận” và “Physical AI”, thực chất truyền tải một tín hiệu rất rõ ràng: thời đại “dồn card để huấn luyện mô hình lớn” đã qua, tương lai cuộc đua AI sẽ xoay quanh việc ứng dụng thực tế của các ứng dụng, gọi là “ứng dụng là vua”.
Nói cách khác, Physical AI chính là giai đoạn thứ hai của Generative AI.
Bởi vì LLM đã đọc hết tất cả dữ liệu tích lũy trong hàng chục năm trên internet của con người, nhưng nó vẫn chưa hiểu cách mở nắp chai như con người. Physical AI chính là để giải quyết vấn đề “tri hành hợp nhất” ngoài trí tuệ AI.
Bởi vì, AI vật lý không thể dựa vào “chu trình phản xạ dài” của máy chủ đám mây từ xa, logic rất đơn giản: để ChatGPT tạo ra văn bản chậm đi một giây, bạn chỉ cảm thấy bị lag, nhưng nếu một robot hai chân vì độ trễ mạng chậm một giây, nó có thể sẽ ngã xuống cầu thang.
Tuy nhiên, Physical AI có vẻ là sự tiếp nối của AI sinh ra, nhưng thực ra đối mặt với ba thách thức mới hoàn toàn khác:

Giáo sư Li Feifei từng đề xuất, trí tuệ không gian là ngôi sao Bắc cực tiếp theo của sự tiến hóa AI. Robot muốn di chuyển, trước tiên phải “hiểu rõ” môi trường. Điều này không chỉ là nhận diện “đây là một chiếc ghế”, mà còn phải hiểu “vị trí, cấu trúc của chiếc ghế trong không gian ba chiều, và tôi cần dùng lực bao nhiêu để di chuyển nó”.
Điều này đòi hỏi lượng dữ liệu môi trường 3D khổng lồ, thời gian thực, phủ kín mọi ngóc ngách trong nhà và ngoài trời;

Omniverse mà Huang Renxun đề cập chính là một dạng “sân chơi huấn luyện ảo”. Trước khi robot bước vào thế giới vật lý thực, nó cần huấn luyện “ngã 10.000 lần” trong môi trường ảo để học đi bộ, quá trình này gọi là Sim-to-Real, tức là từ mô phỏng đến thực tế. Nếu để robot thử sai trực tiếp trong thực tế, chi phí hao mòn phần cứng sẽ là con số kinh khủng.
Quá trình này đòi hỏi khả năng xử lý và render của engine vật lý phải cực kỳ cao, theo cấp số nhân;

Để Physical AI có thể “cảm nhận”, cần có da điện tử để cảm nhận nhiệt độ, áp lực, cảm giác. Những “dữ liệu xúc giác” này là tài sản hoàn toàn mới chưa từng được quy mô hóa thu thập trước đây. Có thể cần cảm biến quy mô lớn, như công ty Ensuring trình diễn tại CES với “da sản xuất hàng loạt”, tích hợp 1.956 cảm biến trên tay, để tạo ra hiệu quả thần kỳ như robot bóp trứng.
Những “dữ liệu xúc giác” này là tài sản hoàn toàn mới chưa từng được quy mô hóa thu thập trước đây.
Xem xong những điều này, chắc chắn bạn sẽ cảm thấy, sự xuất hiện của luận điểm Physical AI đã mở ra cơ hội lớn cho các thiết bị đeo và robot hình người, những thiết bị phần cứng từng bị coi là “đồ chơi lớn” vài năm trước.
Thực ra tôi muốn nói rằng, trong bản đồ mới của Physical AI, lĩnh vực Crypto cũng có cơ hội bổ sung hệ sinh thái cực kỳ tốt. Tôi sẽ ví dụ vài trường hợp:
Các ông lớn AI có thể cử xe cảnh quan quét mọi tuyến phố chính trên thế giới, nhưng lại không thể thu thập dữ liệu ở các ngõ nhỏ, khu dân cư, tầng hầm, và nhờ mạng lưới DePIN cung cấp Token khuyến khích, kích hoạt người dùng toàn cầu dùng thiết bị mang theo để bổ sung dữ liệu, có thể hoàn thành việc này;
Như đã nói, robot không thể dựa vào sức mạnh tính toán đám mây, nhưng trong ngắn hạn cần sử dụng quy mô lớn tính toán biên và khả năng render phân tán, đặc biệt là để hoàn thành nhiều dữ liệu từ mô phỏng đến thực tế. Sử dụng mạng lưới tính toán phân tán, tập hợp phần cứng tiêu dùng còn thừa, phân phối và điều phối, chẳng phải rất tiện sao;
“Dữ liệu xúc giác”, ngoài ứng dụng cảm biến quy mô lớn, tên gọi đã nói lên tính cực kỳ riêng tư, làm thế nào để điều phối cộng đồng chia sẻ dữ liệu liên quan đến quyền riêng tư này cho các ông lớn AI? Con đường khả thi là cho người đóng góp dữ liệu được xác nhận quyền sở hữu dữ liệu và chia sẻ lợi nhuận.
Tổng kết lại:
Physical AI chính là giai đoạn thứ hai của web2 AI mà ông Huang tuyên bố, vậy còn các lĩnh vực như DePIN, DeAI, DeData trong web3 AI và Crypto thì sao? Bạn nghĩ thế nào?