Những người chơi Pokémon đã huấn luyện 300 tỷ bức ảnh cho công ty để xây dựng "Mô hình thế giới AI", hỗ trợ ngành công nghiệp robot giao đồ ăn

ChainNewsAbmedia

Với trò chơi thực tế tăng cường Pokémon Go gây sốt toàn cầu, công ty phát triển trò chơi Niantic thuộc tập đoàn Niantic đã thành lập công ty AI Niantic Spatial, đang sử dụng hàng tỷ hình ảnh thành phố do người chơi chụp trong nhiều năm để xây dựng hệ thống định vị thị giác hiểu thế giới thực và mô hình AI thế giới. Công nghệ này có thể định vị chính xác trong môi trường đô thị không ổn định tín hiệu GPS, đã hợp tác thử nghiệm với các công ty robot giao hàng, mở ra hướng đi mới cho khả năng định hướng của robot và AI trong thế giới thực.

Hình ảnh người chơi Pokémon Go trở thành dữ liệu huấn luyện AI, xây dựng mô hình thế giới từ ảnh thành phố

Kể từ khi ra mắt năm 2016, Pokémon Go nhanh chóng trở thành trò chơi phổ biến toàn cầu, người chơi dùng camera điện thoại bắt Pokémon trong thế giới thực. Trò chơi nổi tiếng này do Niantic phát triển, dù đã ra mắt nhiều năm nhưng vẫn duy trì hơn 100 triệu người chơi hoạt động hàng năm.

Tuy nhiên, trong quá trình chơi, người chơi liên tục hướng camera điện thoại vào các tòa nhà và địa danh, vô tình tích lũy lượng lớn dữ liệu hình ảnh cho công ty.

Gần đây, công ty AI Niantic Spatial của Niantic cho biết đã thu thập và tổ chức khoảng 30 tỷ bức ảnh từ môi trường đô thị toàn cầu, tất cả đều kèm theo thông tin vị trí chính xác và dữ liệu chụp như hướng điện thoại, tốc độ di chuyển và góc chụp. Dữ liệu này hiện đang được dùng để huấn luyện AI, xây dựng mô hình thế giới (World Model) có thể hiểu không gian thực.

(Phân tích sâu: LLM có tồn tại hạn chế? Tại sao Yang Likun đặt cược vào hướng đi World Model của AMI)

Hệ thống định vị thị giác vs GPS: AI có thể xác định chính xác vị trí qua hình ảnh kiến trúc

Theo NewsForce, công nghệ mới nhất của Niantic Spatial là hệ thống định vị thị giác (Visual Positioning System, VPS). Mô hình AI này phân tích hình ảnh kiến trúc hoặc địa danh để xác định vị trí của người dùng, độ chính xác có thể đạt đến cấp độ centimet.

Công ty cho biết, hiện đã có hơn 1 triệu địa danh toàn cầu trong cơ sở dữ liệu. Tại mỗi địa điểm, có thể tích lũy hàng nghìn hình ảnh chụp ở các thời điểm, góc độ và điều kiện thời tiết khác nhau. AI so sánh các đặc trưng hình ảnh này để tính toán vị trí và hướng nhìn của thiết bị, đưa ra kết quả định vị khá chính xác.

Giám đốc công nghệ của Niantic Spatial, Brian McClendon, cho biết, điều này khác với định vị GPS truyền thống dựa vào tín hiệu vệ tinh, VPS dựa vào “nhìn thấy gì” để xác định vị trí:

Trong môi trường đô thị cao tầng, tín hiệu GPS thường xuyên bị lệch, có thể gây ra sai số hàng chục mét hoặc hướng sai.

Sai số này không ảnh hưởng lớn đến người dùng thông thường, nhưng đối với robot cần định hướng chính xác, có thể gây ra vấn đề lớn. Vì vậy, công nghệ định vị dựa trên nhận diện hình ảnh cũng là giải pháp mà các công ty robot quan tâm.

Từ việc bắt Pokémon đến giao hàng: robot giao hàng bắt đầu áp dụng công nghệ của Niantic

Hiện tại, Niantic Spatial đã hợp tác thử nghiệm với công ty robot giao hàng Coco Robotics. Coco đã triển khai khoảng 1.000 robot giao hàng tại nhiều thành phố ở Mỹ và châu Âu, chủ yếu phục vụ giao đồ ăn và hàng tạp hóa. Các robot này nhỏ như vali nhỏ, có thể chở tối đa 8 chiếc pizza lớn hoặc 4 túi hàng tạp hóa.

Công ty cho biết, dù đã hoàn thành hơn 500.000 chuyến giao hàng, đôi khi robot vẫn gặp khó khăn do định vị GPS không chính xác, khiến chúng khó dừng đúng tại cửa hàng hoặc trước nhà khách hàng:

Nhờ mô hình định vị thị giác của Niantic, robot có thể sử dụng bốn camera gắn trên để phân tích môi trường xung quanh, xác định vị trí và hướng đi chính xác hơn, nâng cao độ tin cậy trong giao hàng.

Thời đại robot đã đến: Niantic muốn xây dựng “bản đồ sống”

Giám đốc điều hành của Niantic Spatial, John Hanke, cho biết, ban đầu phát triển công nghệ định vị thị giác nhằm hỗ trợ kính AR và ứng dụng thực tế tăng cường, nhưng khi ngành robot phát triển nhanh, công ty bắt đầu chuyển hướng công nghệ sang định hướng robot.

Ông nói rằng, công ty đang xây dựng một hệ thống gọi là “Bản đồ sống (Living Map)”, là một mô hình thế giới kỹ thuật số có độ chi tiết cao và liên tục cập nhật, phản ánh sự thay đổi của thế giới thực.

Trong tương lai, robot giao hàng, thiết bị thông minh và thậm chí thiết bị AR có thể trở thành nguồn dữ liệu bản đồ, liên tục gửi về thông tin môi trường, khiến thế giới số ngày càng gần với hình thái động của thế giới thực.

AI cần hiểu thế giới thực: “Mô hình thế giới” trở thành trọng tâm công nghệ mới

Trong những năm gần đây, lĩnh vực nghiên cứu AI bắt đầu chú trọng khái niệm “mô hình thế giới (World Model)”. Mặc dù các mô hình ngôn ngữ lớn (LLM) thể hiện xuất sắc trong xử lý văn bản và kiến thức, nhưng vẫn còn hạn chế rõ rệt trong việc hiểu không gian vật lý và môi trường thực.

Thông qua kết hợp bản đồ, hình ảnh và thông tin môi trường, mô hình thế giới nhằm giúp AI hiểu các vật thể, mối quan hệ không gian và biến đổi của môi trường. Các công ty như Google DeepMind cũng đang phát triển các mô hình tạo ra thế giới ảo để huấn luyện AI đại lý.

Niantic Spatial có chiến lược khác, sử dụng lượng lớn dữ liệu hình ảnh thực tế để dần xây dựng lại mô hình kỹ thuật số của thế giới thực. Khi dữ liệu tích lũy đủ, hệ thống này có thể trở thành nền tảng quan trọng để robot và AI hiểu thế giới thực trong tương lai.

Bài viết này về “Hình ảnh 300 tỷ của người chơi Pokémon giúp xây dựng ‘Mô hình thế giới AI’, hỗ trợ ngành robot giao hàng” ban đầu xuất hiện trên Chain News ABMedia.

Xem bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận