Jogadores de Pokémon treinam a empresa com 30 mil milhões de fotos para construir um "modelo de mundo de IA", impulsionando a indústria de robôs de entrega

ChainNewsAbmedia

O jogo de realidade aumentada que conquistou o mundo, Pokémon Go, desenvolvido pela Niantic, está a utilizar as dezenas de bilhões de imagens de cidades capturadas pelos jogadores ao longo dos anos para criar um sistema de localização visual que compreende o mundo real, juntamente com um modelo de IA do mundo. Esta tecnologia permite uma localização precisa em ambientes urbanos com sinais de GPS instáveis e já foi testada em parceria com empresas de robôs de entrega, abrindo novos horizontes para a navegação de robôs e IA no mundo real.

Imagens de jogadores de Pokémon Go como dados de treino de IA, construção de modelos do mundo a partir de fotos urbanas

Desde o seu lançamento em 2016, Pokémon Go tornou-se rapidamente um jogo popular globalmente, com jogadores usando a câmara do telemóvel para capturar Pokémon no mundo real. Este jogo de realidade aumentada (AR), desenvolvido pela Niantic, mantém atualmente mais de 100 milhões de jogadores ativos por ano, mesmo após vários anos no mercado.

No entanto, durante o jogo, os jogadores precisam constantemente apontar a câmara do telemóvel para edifícios e marcos urbanos, acumulando inadvertidamente uma vasta quantidade de dados de imagem.

Recentemente, a Niantic Spatial, a empresa de IA da Niantic, anunciou que recolheu e organizou cerca de 30 mil milhões de fotos de ambientes urbanos globais, todas com informações precisas de localização, incluindo direção do telemóvel, velocidade de movimento e ângulo de captura. Estes dados estão a ser utilizados para treinar IA na construção de um «modelo do mundo» que compreende o espaço real.

(Análise aprofundada: Defeitos dos LLM? Por que Yang Likun aposta na rota do Modelo do Mundo)

Sistema de localização visual vs GPS: IA pode determinar localização com imagens de edifícios

De acordo com a NewsForce, a mais recente tecnologia desenvolvida pela Niantic Spatial é um Sistema de Localização Visual (VPS). Este modelo de IA analisa fotos de edifícios ou marcos para determinar a localização do utilizador, com precisão que pode chegar ao nível de centímetros.

A empresa afirma que a sua base de dados cobre atualmente mais de um milhão de locais de marcos em todo o mundo. Em cada local, podem acumular-se milhares de imagens capturadas em diferentes horários, ângulos e condições meteorológicas. A IA compara as características dessas imagens para estimar a posição do dispositivo e a direção de visualização, produzindo uma localização relativamente precisa.

O diretor técnico da Niantic Spatial, Brian McClendon, explica que isto difere do GPS tradicional, que depende de sinais de satélite. O VPS determina a localização através do «que vê», ou seja, das imagens captadas:

Em ambientes urbanos densos, os sinais de GPS frequentemente apresentam desvios, podendo causar erros de localização de dezenas de metros ou até direções incorretas.

Embora estes erros tenham pouco impacto para utilizadores comuns, podem representar problemas graves para robôs que necessitam de navegação precisa. Assim, a tecnologia de localização baseada em reconhecimento de imagens é uma solução que as empresas de robótica estão a explorar.

De capturar Pokémon a fazer entregas: robôs de entrega começam a usar tecnologia da Niantic

A Niantic Spatial já está a colaborar com a Coco Robotics para testar a sua tecnologia. A Coco implementou cerca de 1.000 robôs de entrega em várias cidades nos EUA e na Europa, utilizados principalmente para entregas de comida e mercearias. Estes robôs, do tamanho de uma mala de mão, podem transportar até oito pizzas grandes ou quatro sacos de compras.

A empresa afirma que, apesar de já terem realizado mais de 500 mil entregas, às vezes os robôs ainda enfrentam dificuldades devido à imprecisão do GPS, dificultando que parem precisamente na porta do restaurante ou do cliente:

Com o sistema de localização visual da Niantic, os robôs podem usar as quatro câmaras instaladas para analisar o ambiente ao redor, permitindo uma determinação mais precisa da posição e direção de movimento, aumentando a fiabilidade das entregas.

Era dos robôs: Niantic quer criar um «Mapa Vivo»

O CEO da Niantic Spatial, John Hanke, explica que a tecnologia de localização visual foi inicialmente desenvolvida para suportar óculos de AR e aplicações de realidade aumentada, mas com o rápido crescimento da indústria de robôs, a empresa começou a direcionar a tecnologia para navegação de robôs.

Ele revela que estão a construir um sistema chamado «Mapa Vivo», uma representação digital do mundo altamente detalhada e continuamente atualizada, que reflete as mudanças no ambiente real.

No futuro, robôs de entrega, dispositivos inteligentes e até dispositivos de AR poderão fornecer dados ao mapa, enviando informações ambientais continuamente, aproximando cada vez mais o mundo digital da sua contraparte real em movimento.

IA precisa compreender o mundo real: «Modelo do Mundo» torna-se foco tecnológico

Nos últimos anos, a pesquisa em IA tem dado especial atenção ao conceito de «Modelo do Mundo». Apesar do excelente desempenho dos Modelos de Linguagem de Grande Escala (LLM) na manipulação de texto e conhecimento, eles ainda apresentam limitações evidentes na compreensão do espaço físico e do ambiente real.

Ao combinar mapas, imagens e informações ambientais, o objetivo do Modelo do Mundo é permitir que a IA compreenda objetos, relações espaciais e mudanças no ambiente. Empresas como a Google DeepMind também estão a desenvolver modelos capazes de gerar mundos virtuais para treinar agentes de IA.

A Niantic Spatial adota uma abordagem diferente, usando uma vasta quantidade de imagens do mundo real para reconstruir progressivamente um modelo digital do ambiente físico. Com a acumulação contínua de dados, este sistema pode tornar-se uma infraestrutura fundamental para que robôs e IA compreendam o mundo real no futuro.

Este artigo «Jogador de Pokémon treina a empresa com 30 mil milhões de fotos para criar um ‘Modelo do Mundo AI’, apoiando a indústria de entregas» foi originalmente publicado na Chain News ABMedia.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário