تستخدم شركة Niantic، المطورة للعبة Pokémon Go التي حققت شهرة عالمية، تقنية تحديد الموقع البصرية (VPS) التي تعتمد على 300 مليار صورة لمدن العالم، لتحقيق دقة تصل إلى مستوى السنتيمتر، وتختبر الآن مع 1000 روبوت توصيل.
شركة Niantic Spatial، التابعة لشركة Niantic المطورة للعبة الواقع المعزز الشهيرة Pokémon Go، تستخدم مليارات الصور التي التقطها اللاعبون على مدى سنوات لإنشاء نظام تحديد موقع بصري قادر على فهم العالم الحقيقي ونموذج ذكاء اصطناعي للعالم. يمكن لهذه التقنية أن تحدد الموقع بدقة عالية حتى في بيئات المدينة التي تكون فيها إشارات GPS غير مستقرة، وقد تم التعاون مع شركات روبوتات التوصيل لاختبارها، مما يفتح آفاقًا جديدة لقدرة الروبوتات والذكاء الاصطناعي على التنقل في العالم الحقيقي.
منذ إطلاق Pokémon Go في عام 2016، سرعان ما أصبح لعبة شعبية عالمياً، حيث يلتقط اللاعبون البوكيمون عبر كاميرات هواتفهم في العالم الحقيقي. على الرغم من مرور سنوات على إطلاقها، إلا أن اللعبة لا تزال تحافظ على أكثر من مليار لاعب نشط سنويًا.
لكن خلال اللعب، يضطر اللاعبون إلى توجيه كاميرات هواتفهم باستمرار نحو المباني والمعالم في المدينة، مما أدى بشكل غير مقصود إلى جمع كمية هائلة من الصور.
أعلنت شركة Niantic Spatial، الذراع الذكية الاصطناعية التابعة لشركة Niantic، مؤخرًا أنها جمعت ونظمت حوالي 300 مليار صورة من بيئات حضرية حول العالم، تتضمن معلومات دقيقة عن الموقع الجغرافي، مثل اتجاه الهاتف، سرعة الحركة، وزاوية التصوير. تُستخدم هذه البيانات الآن لتدريب أنظمة الذكاء الاصطناعي لبناء “نموذج عالمي” يفهم الفضاء الحقيقي.
ذكرت صحيفة NewsForce أن التقنية الجديدة التي طورتها Niantic Spatial تسمى “نظام تحديد الموقع البصري” (VPS). يعتمد هذا النموذج على تحليل صور المباني والمعالم لتحديد موقع المستخدم بدقة تصل إلى مستوى السنتيمتر.
قالت الشركة إن قاعدة البيانات تغطي الآن أكثر من مليون معلم حول العالم. في كل موقع، يتم جمع آلاف الصور التي التقطت في أوقات مختلفة، من زوايا مختلفة، وتحت ظروف جوية متنوعة. من خلال مقارنة ميزات هذه الصور، يمكن للذكاء الاصطناعي تحديد موقع الجهاز واتجاه النظر بدقة نسبية.
وأشار بريان مكليودن، رئيس تقنية Niantic Spatial، إلى أن هذا يختلف عن نظام GPS التقليدي الذي يعتمد على إشارات الأقمار الصناعية، حيث يعتمد VPS على “ما تراه” لتحديد الموقع:
في بيئات المدينة ذات المباني الشاهقة، غالبًا ما تتعرض إشارات GPS للانحراف، مما قد يؤدي إلى أخطاء في تحديد الموقع تصل إلى عدة أمتار، وأحيانًا إلى خطأ في الاتجاه.
هذه الأخطاء ليست مشكلة كبيرة للمستخدمين العاديين، لكنها قد تسبب مشاكل كبيرة للروبوتات التي تتطلب دقة عالية في التنقل. لذلك، فإن تقنية تحديد الموقع باستخدام الصور تعتبر حلاً مهمًا يثير اهتمام شركات الروبوتات.
بدأت شركة Niantic Spatial بالتعاون مع شركة Coco Robotics لاختبار التقنية الجديدة. تقوم Coco بنشر حوالي 1000 روبوت توصيل في مدن أمريكية وأوروبية، وتستخدم بشكل رئيسي لتوصيل الطعام والبقالة. هذه الروبوتات بحجم حقيبة سفر صغيرة، ويمكنها حمل حتى 8 بيتزا كبيرة أو 4 أكياس من البقالة.
قالت الشركة إن الروبوتات أكملت أكثر من 500 ألف عملية توصيل، لكن أحيانًا تعاني من أخطاء في تحديد الموقع عبر GPS، مما يصعب عليها التوقف بدقة عند أبواب المطاعم أو منازل العملاء:
باستخدام نموذج تحديد الموقع البصري من Niantic، يمكن للروبوتات تحليل البيئة المحيطة باستخدام أربع كاميرات مدمجة، مما يساعدها على تحديد الموقع واتجاه الحركة بدقة أكبر، وبالتالي تحسين موثوقية التوصيل.
قال جون هانكي، الرئيس التنفيذي لشركة Niantic Spatial، إن الهدف من تطوير تقنية تحديد الموقع البصري كان دعم نظارات الواقع المعزز وتطبيقات AR، لكن مع تطور صناعة الروبوتات بسرعة، بدأوا في توجيه التقنية نحو تنقل الروبوتات.
وأضاف أن الشركة تعمل على بناء نظام يُسمى “الخريطة الحية” (Living Map)، وهو نموذج رقمي دقيق ومتجدد باستمرار، يمكنه تحديث نفسه باستمرار مع تغيرات العالم الحقيقي.
في المستقبل، قد تصبح روبوتات التوصيل، والأجهزة الذكية، وحتى أجهزة AR مصادر لبيانات الخرائط، وتقوم بإرسال معلومات بيئية باستمرار، مما يجعل العالم الرقمي يقترب أكثر من الواقع المتغير.
في السنوات الأخيرة، بدأ مجال أبحاث الذكاء الاصطناعي يركز على مفهوم “نموذج العالم” (World Model). على الرغم من أن نماذج اللغة الكبيرة (LLMs) تظهر أداءً ممتازًا في معالجة النصوص والمعرفة، إلا أنها لا تزال تواجه قيودًا واضحة في فهم الفضاء الفيزيائي والبيئة الحقيقية.
من خلال دمج الخرائط، الصور، والمعلومات البيئية، يسعى نموذج العالم إلى تمكين الذكاء الاصطناعي من فهم الأجسام، العلاقات المكانية، وتغيرات البيئة. شركات مثل Google DeepMind تطور نماذج توليد عوالم افتراضية لتدريب وكلاء الذكاء الاصطناعي.
أما شركة Niantic Spatial، فتتبنى استراتيجية مختلفة، حيث تعتمد على جمع كميات هائلة من الصور الحقيقية لإعادة بناء نموذج رقمي للعالم الحقيقي. مع تراكم البيانات، قد يصبح هذا النظام البنية التحتية الأساسية لفهم الروبوتات والذكاء الاصطناعي للعالم الحقيقي في المستقبل.