閆俊傑 bắt đầu từ thực tập sinh của Baidu, xây dựng MiniMax với 5 tỷ USD, phủ sóng toàn cầu tại 200 quốc gia, 236 triệu người dùng, cổ phiếu tăng gần tám lần trong hai tháng, định giá vượt quá 3000 tỷ HKD; dưới áp lực của lệnh cấm chip, kiến trúc MoE và hướng đi hiệu quả cao với công suất thấp đang trở thành hình mẫu nổi bật cho sự đột phá của AI Trung Quốc. Bài viết này xuất phát từ Lin Wanwan, do ForesightNews tổng hợp, biên dịch và viết bài.
(Trước đó: tiêu tốn 705 USD mỗi tháng, doanh thu bằng không, đây là kết quả bình thường của khởi nghiệp AI Agent)
(Bổ sung nền: Tại sao Trump kêu gọi nhiều quốc gia bảo vệ eo biển Hormuz mà không có đồng minh nào ủng hộ?)
Mục lục bài viết
Chuyển đổi
Năm 2014, Viện nghiên cứu Baidu có một thực tập sinh, tiến sĩ của Viện Tự động hóa Trung Quốc, xuất thân từ một thị trấn ở Hà Nam. Cậu ấy đã tính toán một khoản: sau tốt nghiệp, nơi lý tưởng nhất là IBM, viết Java, lương 280,000 nhân dân tệ mỗi năm.
Tết Nguyên đán 2026, một công cụ Agent tên OpenClaw bùng nổ toàn cầu, các nhà phát triển cần có mô hình lớn hỗ trợ để chạy các tác vụ như bắt chước tôm hùm. Có một mô hình vừa nhanh vừa rẻ, một tuần tiêu thụ 1.44 nghìn tỷ token trên OpenRouter, đứng đầu toàn bộ nền tảng.
Mô hình này gọi là M2.5, công ty tên là MiniMax.
Chỉ sau hai tháng niêm yết, cổ phiếu từ 165 HKD tăng lên 1300 HKD, vốn hóa vượt 3000 tỷ HKD, trong khi công ty này vẫn có doanh thu chưa tới 80 triệu USD mỗi năm.
Người tạo ra MiniMax chính là thực tập sinh của 12 năm trước, đó là Yan Junjie.
Tết Nguyên đán 2021, Yan Junjie về quê Hà Nam ăn Tết, thăm ông ngoại.
Ông ngoại nói với cậu rằng muốn viết một cuốn hồi ký, ghi lại cuộc đời 80 năm của ông. Nhưng ông không biết đánh máy, cũng không thể tổ chức câu chuyện một cách rõ ràng, nói vài lần rồi bỏ dở.
Yan Junjie đã làm trong ngành AI hơn mười năm. Lúc đó, cậu đột nhiên nhận ra rằng, dù những gì cậu làm đã ứng dụng trong ngành, giúp đỡ nhiều doanh nghiệp, nhưng đối với một người già muốn viết hồi ký, thì tất cả đều vô nghĩa.
Chi tiết này sau đó được nhắc đi nhắc lại, mang hơi hướng câu chuyện truyền cảm hứng. Nhưng thực tế, nó giải thích một điều: động lực làm AI của cậu rất đơn giản, là để người bình thường có thể sử dụng thật sự. Niềm đam mê này sau đó đã thúc đẩy một loạt quyết định phản trực giác.
Cuối năm 2021, cậu rời khỏi SenseTime.
Thời điểm rất quan trọng. Khi đó, SenseTime đang chuẩn bị IPO tại Hong Kong, cậu là phó tổng giám đốc, phó viện trưởng viện nghiên cứu, CTO của nhóm doanh nghiệp thành phố thông minh, rời đi khi công ty còn ở đỉnh cao giá trị. Cậu chưa kịp IPO, chưa kịp hiện thực hóa tài sản, đã rời đi.
ChatGPT chỉ được ra mắt vào tháng 11 năm 2022.
MiniMax thành lập tháng 12 năm 2021.
Khoảng cách thời gian này trở thành nền tảng cho mọi thứ sau này. Yan Junjie sau này nói rằng, nếu không làm sớm, trong môi trường tài chính ngày càng ưu ái các nhà nghiên cứu nổi bật và các công ty lớn có nền tảng AI, thì MiniMax không thể cạnh tranh nổi.
Cha mẹ cậu đều là người bình thường. Học trung học ở thị trấn, thi đỗ Đại học Đông Nam, sau đó học tiến sĩ tại Viện Tự động hóa Trung Quốc, rồi sau đó làm nghiên cứu sau tiến sĩ tại Tsinghua, rồi gia nhập SenseTime, từng bước đi lên, không có nền tảng quốc tế hay mối quan hệ đặc biệt nào.
Trong thời gian thực tập tại Baidu, cậu có giao lưu với Yu Kai của Horizon Robotics. Sau này, Yu Kai nói rằng, khả năng học thuật có thể rèn luyện, nhưng người có thể đưa công nghệ AI vào thực tế, ứng dụng vào kỹ thuật, là rất hiếm. Yan Junjie là một trong số đó.
Sau khi gia nhập SenseTime, trong vòng bảy năm, từ thực tập sinh trở thành phó tổng giám đốc. Năm 2018, trong bối cảnh thiếu nhân lực, cậu dẫn đội phát triển một bộ thuật toán mô hình “All for One”, vượt mặt các đối thủ như Megvii và Yitu trong các cuộc đấu thầu, giành vị trí số một trong ngành. Có người nhận xét rằng, cậu “tốc độ đọc các bài báo nhanh, không quan tâm đến những luận điệu sáo rỗng, chỉ chú trọng vào tinh hoa và ý chính”. Hiệu quả này sau đó trở thành văn hóa của MiniMax.
Cậu đặt tên công ty là MiniMax, lấy cảm hứng từ thuật toán tối đa hóa tối thiểu trong lý thuyết trò chơi của von Neumann.
Giải thích của cậu là, khi ra quyết định, cần phòng ngừa rủi ro tồi nhất trước, rồi chọn giải pháp tối ưu tương đối.
Tháng 12 năm 2021, MiniMax hoàn thành vòng gọi vốn thiên thần, 31 triệu USD, định giá trước khi rót vốn là 170 triệu USD. Các nhà đầu tư gồm Mihoyo, IDG, Hillhouse, Yunqi.
Khoản tiền của Mihoyo khá đặc biệt. Yan Junjie và Chủ tịch Liu Wei của Mihoyo khá thân thiết, đã đầu tư vòng thiên thần, hiện Liu Wei vẫn là thành viên không điều hành trong Hội đồng quản trị của MiniMax.
Mihoyo vốn đã là khách hàng của MiniMax, các NPC trong game, tạo nội dung câu chuyện đều dùng mô hình của họ.
Sau vòng gọi vốn thiên thần, có một sự kiện nhỏ xảy ra.
Tháng 3 năm 2023, Ngân hàng Silicon Valley tuyên bố phá sản. Tất cả vốn của MiniMax đều gửi tại ngân hàng đó. Đây là lần nguy hiểm nhất trong giai đoạn đầu khởi nghiệp, mất hết tiền, môi trường huy động vốn còn hỗn loạn. Nhưng họ đã vượt qua, hai tháng sau, vòng A gọi vốn thành công, 257 triệu USD, định giá 1.157 tỷ USD.
Danh sách các nhà đầu tư tiếp theo ngày càng ấn tượng. Alibaba tham gia, Tencent tham gia, Sequoia Capital cũng theo vào. Trước khi IPO, đã trải qua 7 vòng gọi vốn, tổng cộng gần 1.5 tỷ USD, định giá 4.2 tỷ USD. Sau IPO, Alibaba nắm giữ 12.52%, là cổ đông lớn nhất bên ngoài.
Yan Junjie có thói quen chỉ gặp gỡ các tổ chức đầu tư hàng đầu. Cậu đã gặp Shen Nanpeng của Sequoia, Zhang Lei của Hillhouse.
Nhưng trong bảng cổ đông này còn có một người đáng nói riêng: Yuan Yiyi.
Sinh năm 1994, tốt nghiệp cử nhân kỹ thuật điện tử tại Johns Hopkins, phụ thêm kinh tế và toán học. Tốt nghiệp đại học năm 2017, đã gia nhập SenseTime, làm về huy động vốn và chiến lược đầu tư, một năm sau trở thành trợ lý điều hành của CEO Xu Li kiêm trưởng phòng chiến lược. Cô tham gia sâu vào toàn bộ quá trình từ giai đoạn đầu của SenseTime đến khi IPO tại Hồng Kông.
Năm 2021, cô cùng Yan Junjie bắt đầu khởi nghiệp.
Có nhà đầu tư nhận xét về cô rằng: “Chuyên nghiệp, khí chất, năng lực thực thi mạnh, có vẻ trưởng thành hơn tuổi.” Cô và Yan Junjie phân công rõ ràng: một người định hướng công nghệ, một người biến tầm nhìn thành tiền và nguồn lực. Yan Junjie có thể đào sâu vào kỹ thuật, dù tóc đã cạo sạch cũng không sao, còn thị trường, vốn, toàn cầu hóa là chiến trường của Yuan Yiyi.
Ngày khai trương niêm yết, hai người cùng đứng trên sân khấu. Yuan Yiyi 31 tuổi, giá trị hơn 40 tỷ HKD.
Khi MiniMax lên sàn, toàn công ty có 385 người, trung bình 29 tuổi.
Từ khi thành lập đến tháng 9 năm 2025, tổng chi tiêu khoảng 500 triệu USD. Trong cùng thời gian, OpenAI đã tiêu khoảng 40-55 tỷ USD.
So sánh này có phần kỳ quặc. Dù chỉ dùng chưa tới 1% ngân sách của đối thủ, họ đã tạo ra một công ty dẫn đầu toàn cầu về đa mô hình. Tiết kiệm chi phí chỉ là kết quả. Thực chất, lý do chính là họ đã đưa AI đến mức tối đa. Khoảng 80% mã nguồn của công ty do AI viết, gọi AI là “thực tập sinh” nội bộ, những thực tập sinh này có quyền truy cập trực tiếp vào kho mã, chỉnh sửa môi trường trực tuyến, trong Feishu trò chuyện với nó, sau khi review là có thể đưa lên vận hành ngay.
Hiệu suất này khiến năng suất trung bình của nhân viên MiniMax cao một cách bất thường.
Về sản phẩm, họ từ đầu đã theo hướng đa mô hình: ngôn ngữ, video, âm thanh, nhạc, đồng thời đẩy mạnh cả bốn lĩnh vực. Người khác đều đang học ChatGPT để làm đối thoại, Yan Junjie tập trung vào tích hợp đa mô hình. Cậu nhận định rằng, đa mô hình là nền tảng để nâng cao trí tuệ liên tục, không làm đa mô hình thì thế hệ mô hình tiếp theo sẽ không có cơ hội.
Vào mùa hè 2023, cậu đưa ra quyết định còn táo bạo hơn.
Dồn 80% công suất tính toán và nguồn lực R&D vào MoE (hệ thống chuyên gia hỗn hợp).
Thời điểm đó, các công ty trong nước vẫn đang phát triển các mô hình dày đặc, MoE được xem là công nghệ “tiên tiến nhưng chưa chín chắn”. Giải thích của Yan Junjie rất đơn giản: nếu muốn phục vụ hàng chục triệu, hàng trăm triệu người dùng, chi phí sinh token và độ trễ của mô hình dày đặc không thể chịu nổi. Không làm MoE thì quy mô không thể mở rộng, mọi thứ đều vô nghĩa.
Đầu năm 2024, MiniMax ra mắt mô hình lớn MoE đầu tiên trong nước.
Về sản phẩm, họ cũng không cạnh tranh thị trường trong nước. Phía người dùng cuối, họ phát triển Xingye và Talkie, một trong trong nước, một ở quốc tế, để làm AI đồng hành; Hailuo AI làm video sinh, nửa cuối năm 2024 liên tục trong sáu tháng dẫn đầu toàn cầu về hoạt động hàng tháng của ứng dụng video sinh.
Hiện tại, số liệu: 236 triệu người dùng, phủ sóng 200 quốc gia và khu vực, doanh thu quốc tế chiếm 73%. 21,4 vạn khách hàng doanh nghiệp và nhà phát triển, Google Vertex AI, Microsoft Azure, AWS đều đã triển khai mô hình của MiniMax, Notion là lựa chọn mô hình mã nguồn mở đầu tiên, cũng là của MiniMax.
Tháng 2, doanh thu ARR vượt 150 triệu USD, lượng token tiêu thụ hàng ngày của dòng M2 gấp 6 lần tháng 12 năm ngoái, trong đó hướng lập trình tăng hơn 10 lần.
Đây chính là lý do thị trường sẵn sàng trả gấp 200 lần tỷ lệ doanh thu trên thị trường.
Nhưng có một số số liệu cần phân tích rõ hơn.
Trong báo cáo tài chính, tỷ suất lợi nhuận gộp của phía người dùng cuối là 4,7%, của phía doanh nghiệp là 69,4%. 67% doanh thu của công ty đến từ phía người dùng cuối, nhưng phần này gần như không đóng góp lợi nhuận gộp. Trong quý 4, lợi nhuận gộp của phía người dùng cuối đã giảm còn khoảng 2,1%. Tổng lợi nhuận gộp từ 12,2% tăng lên 25,4%, chủ yếu do tỷ trọng doanh thu từ phía doanh nghiệp tăng nhanh trong quý cuối, kéo theo con số chung tăng lên.
Đây là một bài toán chưa có lời giải.
Tháng 6 năm 2025, MiniMax ra mắt mô hình M1.
Yan Junjie đăng một câu trên mạng xã hội:
“Lần đầu cảm nhận được rằng núi lớn không thể vượt qua.”
Phía sau câu nói này là thực tế, khả năng công nghệ của các mô hình hàng đầu Trung Quốc và Mỹ có thể chỉ chênh lệch 5%, nhưng 5% này khiến các công ty nước ngoài chiếm lĩnh các cảnh quan có giá trị gấp 10 lần, thu phí cao gấp 10 lần, cuối cùng tạo ra chênh lệch thương mại gần trăm lần. Giá trị của OpenAI hiện tại vượt quá 7000 tỷ USD. Trong khi đó, MiniMax niêm yết chỉ có giá trị 800 tỷ HKD, chưa tới 100 tỷ USD.
Cậu đã từng dự đoán rằng, trong tương lai toàn cầu sẽ có năm công ty hàng đầu về AGI, trong đó ít nhất hai đến từ Trung Quốc, thậm chí có một công ty có thể đứng đầu.
Sau khi IPO ngày 9 tháng 1, cậu ngay lập tức xuất hiện tại cuộc họp các doanh nhân, chuyên gia do Thủ tướng chủ trì ngày 19 tháng 1, trở thành người sáng lập mô hình AI lớn thứ hai sau Liang Wenfeng của DeepSeek.
Ngày 2 tháng 3, báo cáo tài chính đầu tiên ra mắt, cổ phiếu Hong Kong tăng mạnh trong ngày.
Trong buổi họp báo, Yan Junjie dành nhiều thời gian nói về một điều: MiniMax cần chuyển từ “công ty mô hình lớn” thành “công ty nền tảng của thời đại AI”.
Cậu đưa ra công thức giá trị nền tảng: Mật độ trí tuệ × Tốc độ tiêu thụ token. Trong thời đại internet, nền tảng là nơi thu hút lưu lượng, còn trong thời đại AI, nền tảng là nơi định nghĩa giới hạn trí tuệ và cùng lúc hưởng lợi nhuận thương mại. Google đang làm, OpenAI cũng vậy, họ cũng muốn làm.
Đối thủ của cậu, quy mô gấp hàng chục lần.
Việc niêm yết tại Hong Kong chỉ đưa cậu đến một chiến trường khác. Báo cáo quý, nhà phân tích, áp lực về vốn hóa, tất cả những thứ này hoàn toàn khác với việc viết mã. Thị trường thứ cấp không tin vào cảm xúc, chỉ nhìn vào số liệu. Liệu câu chuyện về phía người dùng cuối có thể chuyển thành lợi nhuận gộp không, tốc độ tăng trưởng của phía doanh nghiệp có thể duy trì không, M3 khi nào ra mắt, những câu hỏi này sẽ phải trả lời mỗi quý.
Nhưng nếu nhìn xa hơn, câu chuyện của MiniMax không chỉ là câu chuyện của một công ty.
Những năm gần đây, Mỹ ngày càng siết chặt kiểm soát chip. A100 bị hạn chế bán, H100 bị hạn chế bán, H800 cũng bị hạn chế. Logic rất rõ ràng: bóp nghẹt năng lực tính toán, nghĩa là bóp nghẹt cổ họng của AI.
Trong khi đó, Trung Quốc buộc phải đi một con đường hoàn toàn khác.
DeepSeek dùng H800 chạy gần đạt hiệu quả của H100. MiniMax dùng 5 tỷ USD làm những việc mà OpenAI phải tiêu hàng trăm tỷ USD mới làm được. Yan Junjie đã đặt cược vào MoE năm 2023, vì nguồn lực hạn chế không đủ để duy trì khả năng suy luận của hàng triệu người dùng. Mô hình M2.5 chạy liên tục một giờ chỉ tốn 1 USD, bằng 1/20 GPT-5. Các kiến trúc chú ý hỗn hợp, chú ý tuyến tính, thuật toán CISPO, đều là những sáng tạo được đẩy ra trong hoàn cảnh bị ép buộc.
Mục đích ban đầu của lệnh cấm chip là để tạo ra khoảng cách lớn hơn, nhưng thực tế lại đẩy các công ty AI Trung Quốc vào một con đường tiến hóa dựa trên hiệu quả cao, công suất thấp.
Tiền ít, hạn chế về khả năng, ít người, nhưng lại thúc đẩy khả năng kỹ thuật tối ưu và đổi mới kiến trúc cực đoan.
Điều này giống như lý luận của Huawei khi làm chip: nếu bị cấm một khả năng, tôi sẽ bù đắp bằng các khả năng khác, trong quá trình đó, có thể nảy sinh ra những thứ mà bạn không có.
Hiện tại, OpenAI có hơn 4,000 nhân viên, năm 2025 đã tiêu 8 tỷ USD tiền mặt, đến năm 2030 dự kiến sẽ đầu tư 6000 tỷ USD vào năng lực tính toán. MiniMax chỉ có 385 người, tổng chi phí đã là 500 triệu USD.
Chưa ai biết ai thắng. Nhưng ít nhất hiện tại, ngày càng ít người dám cược rằng MiniMax sẽ thất bại.
Cậu sinh viên tiến sĩ Hà Nam thực tập tại Baidu năm 2014 có lẽ không nghĩ tới, 12 năm sau, vị trí của cậu đứng hôm nay lại gắn liền với một cuộc cạnh tranh công nghệ mang tầm quốc gia, quy mô vận mệnh.
Cậu chọn tiếp tục chạy đua.