Trước Tổng giám đốc AI của Tesla, đồng sáng lập viên OpenAI Andrej Karpathy vào ngày 9 tháng 4 đã đăng một bài viết dài trên X, chỉ ra rằng nhận thức của công chúng về năng lực của AI đang bị chia rẽ một cách nghiêm trọng. Ông cho rằng, những người sử dụng ChatGPT bản miễn phí và những kỹ thuật viên sử dụng hằng ngày các công cụ agent tiên tiến như Codex, Claude Code thực chất đang thảo luận về « những sản phẩm hoàn toàn khác nhau », nhưng cả hai bên đều tin rằng thứ mình nhìn thấy chính là toàn bộ bức tranh của AI.
Hai thế giới, hai kiểu nhận thức về AI
Karpathy hiện chia những người dùng AI thành hai nhóm.
Nhóm thứ nhất là những người đã thử ChatGPT bản miễn phí vào một thời điểm nào đó trong năm ngoái, rồi từ đó hình thành ấn tượng tổng thể về AI. Họ nhìn thấy vô số sai sót của mô hình — ảo giác, kết quả tìm kiếm lạc lối, và ngay cả các vấn đề đơn giản như chế độ giọng nói “nên lái xe hay đi bộ rồi đến tiệm rửa xe” cũng bị nó làm hỏng. Karpathy thừa nhận rằng những vấn đề này thực sự tồn tại, nhưng nhấn mạnh rằng bản miễn phí và các mô hình đã lỗi thời không thể đại diện cho năng lực thực sự của các mô hình agent tiên tiến trước năm 2026.
Nhóm thứ hai thỏa mãn đồng thời hai điều kiện: trả phí để sử dụng các mô hình agent tiên tiến mới nhất (như OpenAI Codex hoặc Claude Code), và sử dụng chuyên nghiệp trong các lĩnh vực kỹ thuật như phát triển phần mềm, toán học, nghiên cứu. Karpathy gọi nhóm người này đang trải qua cú “tấn công tinh thần AI” (AI Psychosis) ở mức độ cao, bởi những tiến bộ gần đây trong lĩnh vực kỹ thuật của các mô hình này “chỉ có thể mô tả là kinh ngạc” — bạn có thể chứng kiến trực tiếp chúng giải quyết các vấn đề kiến trúc phần mềm vốn trước đó cần tới vài ngày, thậm chí vài tuần, chỉ trong vòng một giờ.
Tại sao sự tiến bộ tập trung mạnh ở lĩnh vực kỹ thuật
Karpathy giải thích lý do vì sao việc nâng cao năng lực AI lại đặc biệt rõ rệt trong các lĩnh vực kỹ thuật như phát triển phần mềm, nhưng trong các mục đích phổ thông như tìm kiếm, viết lách, đưa ra gợi ý thì không nổi bật bằng.
Có hai nguyên nhân: thứ nhất, lĩnh vực kỹ thuật cung cấp hàm thưởng có thể kiểm chứng được (ví dụ: kiểm tra xem unit test có pass hay không), nhờ đó huấn luyện tăng cường học (reinforcement learning) vận hành hiệu quả; trong khi đó, việc đánh giá đúng sai kém của chất lượng bài viết khó xác định một cách rõ ràng. Thứ hai, trong các kịch bản B2B, lĩnh vực kỹ thuật mang giá trị thương mại cao hơn, nên các công ty AI đổ vào những hướng này tỷ lệ lớn nhất nguồn lực của đội ngũ.
Hai nhóm không hiểu nhau đang nói gì
Karpathy kết luận rằng hai nhóm người này đang “mỗi bên nói một câu”. Chế độ giọng nói của OpenAI bản miễn phí làm hỏng các vấn đề thường ngày, còn OpenAI bản trả phí cao cấp Codex thì trong vòng một giờ có thể tái cấu trúc toàn bộ kho mã hoặc phát hiện lỗ hổng của hệ thống — cả hai điều đó đều đúng.
Trong phần phản hồi tiếp theo, ông bổ sung rằng có người đã nêu với ông một quan điểm: sự kiện OpenClaw gây ra sự quan tâm lớn đến vậy trong xã hội, chính là vì nó khiến một lượng lớn người không thuộc giới kỹ thuật lần đầu tiên tiếp cận các mô hình agent tiên tiến, trong khi trước đó họ chỉ biết rằng AI tương đương với ChatGPT phiên bản web.
Bài viết Karpathy: Nhận thức về năng lực AI xuất hiện sự đứt gãy nghiêm trọng, bản miễn phí và agent tiên tiến là “những sản phẩm hoàn toàn khác nhau” lần đầu xuất hiện trên Chainews ABMedia.