Vào ngày 26 tháng 2, theo giờ Bắc Kinh, Anthropic, một công ty AI hàng đầu tại Hoa Kỳ, đã công bố việc mua lại Vercept, một công ty khởi nghiệp AI tự động hóa máy tính dựa trên tầm nhìn, để bù đắp cho những thiếu sót về hình ảnh của các chức năng Sử dụng Máy tính. Đây là thương vụ mua lại thứ hai của Anthropic sau khi mua lại công ty khởi nghiệp chuỗi công cụ full-stack Bun vào tháng 12 năm 2025.
Sử dụng máy tính là khả năng cốt lõi của AI điều khiển trực tiếp các máy tính do Anthropic tạo ra cho mô hình lớn Claude, cho phép Claude “nhìn vào màn hình, di chuyển chuột, gõ bàn phím và vận hành phần mềm” như con người và hoàn thành các tác vụ phức tạp nhiều bước và ứng dụng chéo, sẽ được phát hành cùng với Claude 3.5 Sonnet vào tháng 10 năm 2024.
Tuy nhiên, do tắc nghẽn về độ chính xác của sự hiểu biết trực quan, nhận dạng giao diện phức tạp và xử lý cảnh động trong giai đoạn đầu của mô hình, tỷ lệ thành công của thao tác sử dụng máy tính thấp và tác vụ dễ bị lỗi. Sự tích lũy của Vercept trong nhận dạng giao diện người dùng có độ chính xác cao, suy luận không gian, theo dõi giao diện động và xử lý hình ảnh có độ trễ thấp chỉ có thể bù đắp cho những thiếu sót trên.
Theo Anthropic, các nhà phát triển đang sử dụng Claude để xử lý các tác vụ ngày càng phức tạp, bao gồm viết và chạy mã trên các kho lưu trữ, tổng hợp nghiên cứu từ hàng chục nguồn và quản lý quy trình làm việc trên nhiều công cụ và nhóm. Sử dụng máy tính cho phép Claude làm việc trong thời gian thực trong các phần mềm khác nhau như thể anh ấy đang ngồi trước máy tính, hoàn thành nhiều nhiệm vụ nhiều bước không thể thực hiện chỉ bằng mã. Việc mua lại Vercept sẽ giúp công ty nâng cao hơn nữa các khả năng này.
Có trụ sở chính tại Seattle, Hoa Kỳ, Vercept được thành lập bởi cựu sinh viên Viện AI (AI2) Allen và định vị Tác nhân AI ưu tiên tầm nhìn, tập trung vào tự động hóa không có API “nhìn vào màn hình và điều khiển máy tính như con người”. Các thành viên nòng cốt trong nhóm chịu trách nhiệm về robot và trí thông minh hiện thân, Tác nhân AI và học tăng cường.
Dựa trên sự tích lũy công nghệ và nền tảng của đội ngũ sáng lập, Vercept đã hoàn thành vòng tài trợ hạt giống trị giá 16 triệu đô la vào tháng 1 năm 2025, trị giá khoảng 67 triệu đô la và danh sách các nhà đầu tư bao gồm cựu Giám đốc điều hành Google Eric Schmidt, nhà khoa học trưởng của Google DeepMind Jeff Dean, người sáng lập Cruise Kyle Vogt và những người khác. Tổng số tiền mà Vercept huy động được là khoảng 50 triệu đô la.
Anthropic tin rằng chuyên môn của Vercept về nhận thức và tương tác có thể áp dụng trực tiếp cho một số vấn đề khó khăn nhất mà Anthropic đang giải quyết. Ứng dụng máy tính để bàn Vercept Vy sẽ bị đóng cửa trong 30 ngày và là một phần của quá trình chuyển đổi, Vercept khuyến khích người dùng dùng thử công cụ Claude của Anthropic như một giải pháp thay thế khi kết thúc dịch vụ.
Nói về những cân nhắc mua lại, người đồng sáng lập Vercept Luca Weihs nói rằng trong tương lai, khả năng hoàn thành các nhiệm vụ công việc dựa trên tri thức của Claude sẽ tương đương với mức độ mã mà nó viết ngày nay, có nghĩa là cách mọi người tương tác với máy tính về cơ bản có thể thay đổi để đảm bảo rằng trải nghiệm tương tác này cũng quan trọng như mô hình cơ bản.
Việc mua lại phản ánh sự cạnh tranh ngày càng tăng trong đường đua AI Agent có thể điều khiển máy tính và các thiết bị khác cũng như hoàn thành nhiệm vụ cho người dùng. Ngoài Anthropic, OpenAI cũng đang tích cực triển khai. Vào giữa tháng Hai, người sáng lập OpenClaw Peter Steinberger đã thông báo rằng ông sẽ tham gia OpenAI toàn thời gian để phát triển thế hệ tác nhân AI cá nhân tiếp theo. Dự án OpenClaw không được OpenAI mua lại hoặc sáp nhập vào công ty, mà được chuyển giao cho Quỹ nguồn mở độc lập, tiếp tục duy trì giao thức nguồn mở MIT và quyền tự chủ cộng đồng. OpenAI cung cấp tài trợ, công nghệ và tài trợ tài nguyên mô hình, nhưng không sở hữu hoặc kiểm soát các quyết định của dự án. Thông qua phương pháp “giới thiệu nhân tài”, nó bổ sung cho khả năng của OpenAI trong việc hạ cánh các Đại lý AI cá nhân và bảo vệ lợi thế hàng đầu của Anthropic trong các đại lý cấp doanh nghiệp.
Mặc dù có sự khác biệt về phương thức hoạt động, nhưng về cơ bản nó là một cuộc đặt cược giữa hai công ty trên đường đua AI Agent. Người sáng lập Anthropic Dario Amodei cho biết trong một cuộc phỏng vấn gần đây rằng hình thức cuối cùng của sự tiến hóa AI không phải là một trình tạo văn bản, mà là một hệ thống thực thi vòng kín với điều khiển máy tính phổ quát. Nó có thể hoàn thành các nhiệm vụ sản xuất phức tạp như chỉnh sửa video và kỹ thuật phần mềm bằng cách quan sát màn hình, tham khảo lịch sử, hiểu ngữ cảnh và cộng tác trên các nền tảng như con người.
Trở ngại chính trong ngành hiện tại không phải là trí thông minh, mà là độ tin cậy tương tác - tức là khả năng mô hình đủ mạnh, nhưng vẫn chưa đủ để hoàn thành nhiệm vụ một cách ổn định, chính xác và không có lỗi. Trong một đến ba năm tới, AI sẽ giải quyết hầu hết các nhu cầu công việc đòi hỏi “học tập tại chỗ” thông qua sự kết hợp giữa quản lý ngữ cảnh dài và kiểm soát thị giác máy tính.
(Nguồn bài viết: Yicai)
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Anthropic mua lại OpenAI tranh giành nhân sự “Song mạnh của Silicon Valley” đang tính toán gì?
Vào ngày 26 tháng 2, theo giờ Bắc Kinh, Anthropic, một công ty AI hàng đầu tại Hoa Kỳ, đã công bố việc mua lại Vercept, một công ty khởi nghiệp AI tự động hóa máy tính dựa trên tầm nhìn, để bù đắp cho những thiếu sót về hình ảnh của các chức năng Sử dụng Máy tính. Đây là thương vụ mua lại thứ hai của Anthropic sau khi mua lại công ty khởi nghiệp chuỗi công cụ full-stack Bun vào tháng 12 năm 2025.
Sử dụng máy tính là khả năng cốt lõi của AI điều khiển trực tiếp các máy tính do Anthropic tạo ra cho mô hình lớn Claude, cho phép Claude “nhìn vào màn hình, di chuyển chuột, gõ bàn phím và vận hành phần mềm” như con người và hoàn thành các tác vụ phức tạp nhiều bước và ứng dụng chéo, sẽ được phát hành cùng với Claude 3.5 Sonnet vào tháng 10 năm 2024.
Tuy nhiên, do tắc nghẽn về độ chính xác của sự hiểu biết trực quan, nhận dạng giao diện phức tạp và xử lý cảnh động trong giai đoạn đầu của mô hình, tỷ lệ thành công của thao tác sử dụng máy tính thấp và tác vụ dễ bị lỗi. Sự tích lũy của Vercept trong nhận dạng giao diện người dùng có độ chính xác cao, suy luận không gian, theo dõi giao diện động và xử lý hình ảnh có độ trễ thấp chỉ có thể bù đắp cho những thiếu sót trên.
Theo Anthropic, các nhà phát triển đang sử dụng Claude để xử lý các tác vụ ngày càng phức tạp, bao gồm viết và chạy mã trên các kho lưu trữ, tổng hợp nghiên cứu từ hàng chục nguồn và quản lý quy trình làm việc trên nhiều công cụ và nhóm. Sử dụng máy tính cho phép Claude làm việc trong thời gian thực trong các phần mềm khác nhau như thể anh ấy đang ngồi trước máy tính, hoàn thành nhiều nhiệm vụ nhiều bước không thể thực hiện chỉ bằng mã. Việc mua lại Vercept sẽ giúp công ty nâng cao hơn nữa các khả năng này.
Có trụ sở chính tại Seattle, Hoa Kỳ, Vercept được thành lập bởi cựu sinh viên Viện AI (AI2) Allen và định vị Tác nhân AI ưu tiên tầm nhìn, tập trung vào tự động hóa không có API “nhìn vào màn hình và điều khiển máy tính như con người”. Các thành viên nòng cốt trong nhóm chịu trách nhiệm về robot và trí thông minh hiện thân, Tác nhân AI và học tăng cường.
Dựa trên sự tích lũy công nghệ và nền tảng của đội ngũ sáng lập, Vercept đã hoàn thành vòng tài trợ hạt giống trị giá 16 triệu đô la vào tháng 1 năm 2025, trị giá khoảng 67 triệu đô la và danh sách các nhà đầu tư bao gồm cựu Giám đốc điều hành Google Eric Schmidt, nhà khoa học trưởng của Google DeepMind Jeff Dean, người sáng lập Cruise Kyle Vogt và những người khác. Tổng số tiền mà Vercept huy động được là khoảng 50 triệu đô la.
Anthropic tin rằng chuyên môn của Vercept về nhận thức và tương tác có thể áp dụng trực tiếp cho một số vấn đề khó khăn nhất mà Anthropic đang giải quyết. Ứng dụng máy tính để bàn Vercept Vy sẽ bị đóng cửa trong 30 ngày và là một phần của quá trình chuyển đổi, Vercept khuyến khích người dùng dùng thử công cụ Claude của Anthropic như một giải pháp thay thế khi kết thúc dịch vụ.
Nói về những cân nhắc mua lại, người đồng sáng lập Vercept Luca Weihs nói rằng trong tương lai, khả năng hoàn thành các nhiệm vụ công việc dựa trên tri thức của Claude sẽ tương đương với mức độ mã mà nó viết ngày nay, có nghĩa là cách mọi người tương tác với máy tính về cơ bản có thể thay đổi để đảm bảo rằng trải nghiệm tương tác này cũng quan trọng như mô hình cơ bản.
Việc mua lại phản ánh sự cạnh tranh ngày càng tăng trong đường đua AI Agent có thể điều khiển máy tính và các thiết bị khác cũng như hoàn thành nhiệm vụ cho người dùng. Ngoài Anthropic, OpenAI cũng đang tích cực triển khai. Vào giữa tháng Hai, người sáng lập OpenClaw Peter Steinberger đã thông báo rằng ông sẽ tham gia OpenAI toàn thời gian để phát triển thế hệ tác nhân AI cá nhân tiếp theo. Dự án OpenClaw không được OpenAI mua lại hoặc sáp nhập vào công ty, mà được chuyển giao cho Quỹ nguồn mở độc lập, tiếp tục duy trì giao thức nguồn mở MIT và quyền tự chủ cộng đồng. OpenAI cung cấp tài trợ, công nghệ và tài trợ tài nguyên mô hình, nhưng không sở hữu hoặc kiểm soát các quyết định của dự án. Thông qua phương pháp “giới thiệu nhân tài”, nó bổ sung cho khả năng của OpenAI trong việc hạ cánh các Đại lý AI cá nhân và bảo vệ lợi thế hàng đầu của Anthropic trong các đại lý cấp doanh nghiệp.
Mặc dù có sự khác biệt về phương thức hoạt động, nhưng về cơ bản nó là một cuộc đặt cược giữa hai công ty trên đường đua AI Agent. Người sáng lập Anthropic Dario Amodei cho biết trong một cuộc phỏng vấn gần đây rằng hình thức cuối cùng của sự tiến hóa AI không phải là một trình tạo văn bản, mà là một hệ thống thực thi vòng kín với điều khiển máy tính phổ quát. Nó có thể hoàn thành các nhiệm vụ sản xuất phức tạp như chỉnh sửa video và kỹ thuật phần mềm bằng cách quan sát màn hình, tham khảo lịch sử, hiểu ngữ cảnh và cộng tác trên các nền tảng như con người.
Trở ngại chính trong ngành hiện tại không phải là trí thông minh, mà là độ tin cậy tương tác - tức là khả năng mô hình đủ mạnh, nhưng vẫn chưa đủ để hoàn thành nhiệm vụ một cách ổn định, chính xác và không có lỗi. Trong một đến ba năm tới, AI sẽ giải quyết hầu hết các nhu cầu công việc đòi hỏi “học tập tại chỗ” thông qua sự kết hợp giữa quản lý ngữ cảnh dài và kiểm soát thị giác máy tính.
(Nguồn bài viết: Yicai)