Andre j Karpathy — người đồng sáng lập đội ngũ của OpenAI, cựu giám đốc AI tại Tesla — đã đăng trên X một bài viết dài về “khoảng cách nhận thức năng lực AI”, trả lời một hiện tượng trong cộng đồng: mức độ kinh ngạc với AI bị chia đôi—một nhóm cho rằng AI đã viết lại thế giới, nhóm khác lại nghĩ AI chỉ biết bịa chuyện, nhàm chán, và bị thổi phồng quá đà. Karpathy đưa ra hai chẩn đoán, giải thích vì sao hai nhóm người này giống “hai thế giới song song”, và họ đã hiểu sai các căn cứ phán đoán của nhau. Bài viết dưới đây tổng hợp các luận điểm của ông và rút ra gợi ý cho độc giả công nghệ tại Đài Loan.
Chẩn đoán 1: Bạn đang dùng loại AI nào—thuộc năm nào, và thuộc “tầng” nào?
Quan sát đầu tiên của Karpathy rất thẳng và sắc bén: “Rất nhiều người năm ngoái dùng thử bản miễn phí của ChatGPT, và trải nghiệm đó đã định hình cách họ nhìn về AI.” Phản ứng của nhóm này thường là chế nhạo những hành vi kỳ lạ của mô hình, ảo giác, sự vụng về, và những video lan truyền rằng việc chuyển OpenAI sang chế độ giọng nói nâng cao đã bị lật kèo vì những câu hỏi đơn giản kiểu “Tôi nên lái xe đi rửa xe hay đi bộ”.
Nhưng Karpathy chỉ ra: những mô hình “bản miễn phí, bản cũ, bản bị ngừng dùng” đó hoàn toàn không phản ánh được năng lực của các mô hình agentic tiên tiến nhất vào năm 2026 (đặc biệt là OpenAI Codex và Claude Code). Nói đơn giản: bạn đem ChatGPT miễn phí năm 2024 để phán AI có viết được code hay không, chẳng khác nào đem Nokia E71 năm 2008 để đánh giá một chiếc smartphone có dùng được hay không.
Với nhiều độc giả Đài Loan, đây cũng là chuyện rất thực tế—việc đăng ký ChatGPT Plus (20 USD) vẫn khá phổ biến, nhưng người đăng ký ChatGPT Pro (200 USD), Claude Max (100 USD) thì rất hiếm. Nếu chưa từng chạy agent task ở các tier trả phí cao nhất, bạn sẽ thấy AI chủ yếu là “đồ chơi hay ho nhưng không đáng tin”; còn nếu đã chạy qua, bạn sẽ thấy AI là “cải viết lại toàn bộ quy trình làm việc”. Cùng một công nghệ, nhưng hai thế giới.
Chẩn đoán 2: Tiến bộ năng lực ở các lĩnh vực khác nhau là “bất đối xứng”
Chẩn đoán thứ hai của Karpathy còn thú vị hơn: “Dù bạn trả 200 USD mỗi tháng để dùng mô hình tiên tiến nhất, thì tiến bộ năng lực vẫn mang tính ‘đột phá theo đỉnh’, tập trung vào những lĩnh vực kỹ thuật cao.”
Ông chỉ ra: tìm kiếm, viết lách, gợi ý—những thứ kiểu “truy vấn điển hình” như vậy—không phải là lĩnh vực mà tiến bộ của AI trong vài năm gần đây diễn ra mạnh nhất. Có hai lý do:
Học tăng cường (RL) phụ thuộc vào hàm thưởng có thể kiểm chứng—viết code có tín hiệu rõ ràng kiểu “bài unit test đã pass”, còn viết lách không có tiêu chuẩn khách quan tương ứng, nên tốc độ chênh lệch của RL rất lớn
Giá trị kinh doanh lớn nhất của các công ty như OpenAI, Anthropic nằm ở các bối cảnh B2B về code/research/engineering, nên nguồn lực, nhân lực, và ưu tiên đều dồn vào các lĩnh vực đó; các use case khác không phải là nguồn sinh lợi nhuận tối đa
Nhận định này rất quan trọng—nó giải thích vì sao “AI viết code thì nhảy vọt, nhưng AI viết bài vẫn thường bình thường” lại là một hiện tượng khiến nhiều người bối rối. Không phải vì các công ty AI không làm được, mà là mỏ vàng của họ nằm ở chỗ khác, và sự chú ý cũng đi theo.
Ai chịu “cú sốc nhận thức AI” mạnh nhất? Hai điều kiện phải đồng thời thỏa
Gộp hai chẩn đoán lại, Karpathy mô tả nhóm “bị cú sốc nhận thức AI” nhiều nhất—những người đồng thời thỏa hai điều kiện:
Dùng các mô hình agentic tiên tiến nhất theo hình thức trả phí (OpenAI Codex, Claude Code)
Sử dụng chuyên sâu trong các lĩnh vực kỹ thuật cao (lập trình, toán học, nghiên cứu)
Nhóm này bị tác động mạnh bởi cái gọi là “AI Psychosis”—cách dùng từ của Karpathy—để mô tả cảm giác khi bạn tận mắt thấy LLM giải quyết các bài toán lập trình trước đó phải mất vài ngày đến vài tuần chỉ trong vài giờ: những phán đoán về năng lực AI và độ dốc (slope) sẽ khiến bạn có cái nhìn hoàn toàn khác về cục diện công nghệ trong vài năm tới.
Đối với nhóm người còn lại (không trả phí, không dùng trong lĩnh vực kỹ thuật), những lời như vậy nghe giống kiểu “quá phấn khích”, giống “ảo tưởng của nhóm nhỏ ở Silicon Valley”. Nhưng Karpathy cho rằng đó không phải ảo tưởng, mà là phán đoán thật dựa trên trải nghiệm cá nhân.
Hai nhóm “nói về thế giới của nhau”, chứ không nói chuyện với nhau
Kết luận cốt lõi của Karpathy: “Hai nhóm này nói với nhau về những gì họ thấy, chứ không phải nói với nhau.” Ông mô tả có thể cùng lúc đúng hai chuyện:
Chế độ giọng nói nâng cao của OpenAI miễn phí (và theo tôi là bị bán khai/đình trệ một phần), trên Instagram Reels sẽ làm trẹo những câu hỏi ngớ ngẩn nhất
Trong khi đó, mô hình Codex ở tier trả phí cao nhất của OpenAI sẽ dành khoảng 1 giờ để tái cấu trúc toàn bộ codebase một cách mạch lạc, hoặc tìm ra và tận dụng các lỗ hổng của hệ thống máy tính
Hai chuyện đều đúng, không mâu thuẫn. Nhưng hai nhóm chỉ thấy một phần, rồi nhìn nhau và cho rằng đối phương “quá hưng phấn” hoặc “quá thiếu hiểu biết”. Mục đích của bài viết này là bắc cầu cho khoảng cách đó.
Gợi ý cho độc giả Đài Loan: bạn thuộc nhóm nào?
Luận điểm của Karpathy đặc biệt có ý nghĩa với độc giả Đài Loan, vì ngay trong diễn đàn công nghệ Đài Loan cũng có sự phân cực tương tự: một bên là “AI đã tiếp quản”, bên kia là “chỉ là chatbot thôi”. Xác định bạn thuộc nhóm nào có thể dựa vào 3 câu hỏi tự vấn:
Lần gần đây nhất bạn tự tay đưa prompt cho mô hình tiên tiến trả phí (GPT-5.5 Pro, Claude Opus 4.7) là khi nào?
Bạn có để agent chạy hơn 30 phút và thực sự hoàn thành một tác vụ cấp sản xuất (tái cấu trúc code, viết tổng quan nghiên cứu, debug một hệ thống phức tạp) hay chưa?
Căn cứ bạn dùng để đánh giá năng lực AI đến từ báo chí, meme cộng đồng, hay từ trải nghiệm tự dùng?
Nếu bạn trả lời “có, gần đây, dùng trực tiếp” cho cả ba câu hỏi, thì bạn sẽ rơi vào nhóm thứ hai như Karpathy mô tả, và có thể hiểu tốt hơn cách ông nói về “AI Psychosis”. Nếu bạn trả lời “không, đã rất lâu, xem trên truyền thông” cho cả ba câu hỏi, thì bạn sẽ rơi vào nhóm đầu tiên và có thể đánh giá thấp đáng kể tốc độ tiến bộ của AI.
Không phải nói nhóm nào “đúng”, mà là nền tảng căn cứ phán đoán của các nhóm khác nhau là khác biệt mang tính căn bản. Khi bạn đọc bài tiếp theo kiểu “AI là bong bóng” hoặc “AI sẽ thay thế mọi công việc”, hãy kiểm tra trước tác giả thuộc nhóm nào, rồi mới quyết định cách đọc.
Bổ sung: “Khoảnh khắc OpenClaw” của Karpathy
Trong các bài đăng tiếp theo, Karpathy bổ sung: “Có người gần đây nói với tôi rằng, khoảnh khắc OpenClaw lại lớn như vậy vì đây là một nhóm người không có nền tảng kỹ thuật, và lần đầu tiên họ tự trải nghiệm các mô hình agentic tiên tiến.” Nhận định này cho thấy: khoảng cách nhận thức không chỉ là khác nhau về mức độ, mà còn là khác nhau giữa “trải nghiệm trực tiếp” và “nghe truyền miệng”.
Với độc giả abmedia, cách làm thực dụng nhất là: chi 20 USD, đăng ký ChatGPT Plus hoặc Claude Pro trong 1 tháng, chọn một tác vụ thực tế mà bạn thật sự quan tâm (viết một báo cáo nghiên cứu, tổng hợp một phân tích tài chính, debug một dự án code), cho agent chạy trọn vẹn, rồi quay lại đánh giá ý nghĩa của AI đối với công việc của bạn. Làm vậy còn hữu ích hơn đọc 100 bài tin tức về AI.
Bài viết này: Vì sao có người thấy AI thay đổi thế giới, có người lại thấy nó bình thường? Hai chẩn đoán của Karpathy lần đầu tiên xuất hiện tại chuỗi tin tức ABMedia.
Bài viết liên quan
R0AR tiến vào Vòng chung kết Consensus 2026 PitchFest, chỉ thiếu Top 20 một chút
Musk tìm kiếm khoản dàn xếp 150 tỷ USD với OpenAI trước phiên tòa, các cuộc đàm phán dàn xếp thất bại
Cursor chấp nhận lời đề nghị mua lại 60 tỷ USD của SpaceX nhưng sẽ không hợp tác với xAI về các mô hình lập trình
Haun Ventures đóng quỹ 1 tỷ USD vào ngày 4/5, phân bổ vốn giữa các khoản đầu tư crypto giai đoạn đầu và giai đoạn muộn
OpenAI huy động $4 tỷ để triển khai liên doanh, định giá 10 tỷ USD
Applied Digital đảm bảo khoản tài trợ cầu trị giá 300 triệu USD do Goldman Sachs dẫn đầu cho các trung tâm dữ liệu AI