Pokémon-Spieler trainieren für das Unternehmen 30 Milliarden Fotos, um ein „KI-Weltmodell" zu erstellen und die Lieferroboter-Industrie zu unterstützen

ChainNewsAbmedia

Das weltweit beliebte Augmented-Reality-Spiel Pokémon Go entwickelt unter dem AI-Unternehmen Niantic Spatial, einer Tochtergesellschaft von Niantic, basierend auf Milliarden von Stadtaufnahmen, die von Spielern über die Jahre gemacht wurden, ein „Visuelles Lokalisierungssystem“ und ein AI-Weltmodell, das die reale Welt versteht. Diese Technologie ermöglicht eine präzise Positionsbestimmung in städtischen Umgebungen mit instabilen GPS-Signalen und wurde bereits in Zusammenarbeit mit Lieferrobotern getestet, um neue Wege für die Navigation von Robotern und AI in der realen Welt zu eröffnen.

Pokémon Go-Spielerbilder als AI-Trainingsdaten, Stadtfotos zum Aufbau des Weltmodells

Seit seiner Einführung im Jahr 2016 ist Pokémon Go schnell zu einem globalen Hit geworden, bei dem Spieler mit ihren Handykameras in der realen Welt Pokémon fangen. Das von Niantic entwickelte bekannte AR-Spiel hat trotz seines Alters jährlich immer noch über 100 Millionen aktive Nutzer.

Während des Spiels müssen die Spieler ständig ihre Handykameras auf Stadtgebäude und Wahrzeichen richten, was unabsichtlich eine große Menge an Bilddaten für das Unternehmen sammelt.

Niantic Spatial, eine Tochtergesellschaft für künstliche Intelligenz, gab kürzlich bekannt, dass sie etwa 30 Milliarden Fotos aus städtischen Umgebungen weltweit gesammelt und organisiert haben. Diese Bilder enthalten genaue Geolokalisierungs- und Aufnahmeinformationen wie Handyrichtung, Bewegungsgeschwindigkeit und Aufnahmewinkel. Diese Daten werden nun genutzt, um AI zu trainieren und ein „Weltmodell“ zu erstellen, das die reale Umgebung versteht.

(Deep Dive: Schwächen bei LLM? Warum Yang Likun auf die World Model-Route setzt)

Visuelles Lokalisierungssystem vs GPS: AI kann anhand von Gebäudebildern präzise Positionen bestimmen

NewsForce berichtete, dass die neu entwickelte Technologie von Niantic Spatial ein Visuelles Lokalisierungssystem (Visual Positioning System, VPS) ist. Dieses AI-Modell analysiert Fotos von Gebäuden oder Wahrzeichen, um den Standort des Nutzers zu bestimmen, mit einer Genauigkeit, die sogar Zentimeter erreichen kann.

Das Unternehmen erklärte, dass die Datenbank inzwischen mehr als eine Million Wahrzeichen weltweit abdeckt. An jedem Ort sind möglicherweise Tausende von Bildern aus verschiedenen Zeiten, Blickwinkeln und Wetterbedingungen gespeichert. Durch den Abgleich dieser Bildmerkmale kann die AI die Position und Blickrichtung des Geräts schätzen und so eine relativ präzise Lokalisierung vornehmen.

Der CTO von Niantic Spatial, Brian McClendon, betonte, dass dies sich von herkömmlicher GPS-Ortung unterscheidet, die auf Satellitensignalen basiert. VPS nutzt „Sehen“ zur Positionsbestimmung:

In dicht bebauten Stadtgebieten sind GPS-Signale oft ungenau, was zu Fehlern von mehreren Metern oder sogar in der Richtung führen kann.

Solche Fehler sind für den durchschnittlichen Nutzer kaum relevant, für Roboter, die präzise navigieren müssen, jedoch problematisch. Daher ist die bildbasierte Lokalisierungstechnologie eine Lösung, die auch für Roboterunternehmen von Interesse ist.

Vom Pokémon-Fangen bis zum Lieferservice: Lieferroboter setzen Niantic-Technologie ein

Niantic Spatial arbeitet derzeit mit dem Lieferroboter-Unternehmen Coco Robotics zusammen, um die Technologie zu testen. In mehreren Städten in den USA und Europa sind etwa 1.000 Lieferroboter im Einsatz, die hauptsächlich für Essens- und Lebensmittelzustellungen genutzt werden. Diese Roboter sind etwa so groß wie ein kleiner Koffer und können bis zu acht große Pizzas oder vier Einkaufstüten transportieren.

Das Unternehmen gab an, dass die Roboter bereits über 500.000 Lieferungen durchgeführt haben, aber manchmal aufgrund ungenauer GPS-Ortung Schwierigkeiten haben, genau vor dem Restaurant oder bei der Haustür des Kunden anzuhalten:

Mit Niantics visueller Lokalisierung können die Roboter ihre vier Kameras nutzen, um die Umgebung zu analysieren und so Position und Richtung präziser zu bestimmen, was die Zuverlässigkeit der Zustellung erhöht.

Die Ära der Roboter: Niantic will „Living Map“ schaffen

Der CEO von Niantic Spatial, John Hanke, erklärte, dass die ursprüngliche Entwicklung der visuellen Lokalisierungstechnologie dazu diente, AR-Brillen und Augmented-Reality-Anwendungen zu unterstützen. Mit dem rasanten Wachstum der Roboterbranche begann das Unternehmen jedoch, die Technologie auf die Roboter-Navigation zu fokussieren.

Er kündigte an, ein System namens „Living Map“ zu entwickeln, eine hochdetaillierte und ständig aktualisierte digitale Weltkarte, die sich kontinuierlich an Veränderungen in der realen Welt anpasst.

Zukünftig könnten Lieferroboter, intelligente Geräte und sogar AR-Headsets zu Quellen für Kartendaten werden, die Umweltinformationen in Echtzeit zurückmelden und so die digitale Welt immer näher an die dynamische Realität heranführen.

AI braucht Verständnis für die reale Welt: „World Model“ als neuer Technologiefokus

In den letzten Jahren hat die AI-Forschung das Konzept des „World Model“ in den Mittelpunkt gerückt. Obwohl große Sprachmodelle (LLMs) in Text- und Wissensverarbeitung beeindruckend sind, zeigen sie deutliche Grenzen beim Verständnis physischer Räume und der realen Umwelt.

Durch die Kombination von Karten, Bildern und Umweltdaten versucht das World Model, AI das Verständnis von Objekten, Raumbeziehungen und Umweltveränderungen zu ermöglichen. Unternehmen wie Google DeepMind entwickeln Modelle, die virtuelle Welten generieren können, um AI-Agenten zu trainieren.

Niantic Spatial verfolgt einen anderen Ansatz: Durch die große Menge an echten Weltbildern rekonstruiert das Unternehmen schrittweise ein digitales Modell der realen Welt. Mit zunehmender Datenmenge könnte dieses System eine wichtige Grundlage für das Verständnis der realen Welt durch Roboter und AI werden.

Dieser Artikel „Pokémon-Spieler trainieren 30 Milliarden Fotos für AI-Weltmodell, unterstützen Lieferroboter-Industrie“ erschien zuerst bei ABMedia.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare