Le rythme d’innovation de Waymo dans le domaine des taxis autonomes s’est de nouveau accéléré. Selon les dernières découvertes de la renommée chercheuse en technologie Jane Manchun Wong, Waymo développe un système complet d’assistant IA qui utilise la technologie Gemini de Google pour offrir aux passagers des services à bord. Cette découverte révèle comment les entreprises automobiles autonomes intègrent l’IA conversationnelle dans leurs opérations réelles, marquant l’évolution des taxis autonomes, passant d’un simple « transport » à des « plateformes de mobilité intelligentes ».
Wong a souligné dans un article de blog qu’elle avait trouvé un fichier d’invite système complet dans le code de l’application mobile Waymo, nommé en interne « Waymo Ride Assistant Meta-Prompt », qui compte plus de 1 200 lignes et détaille le comportement de l’assistant IA dans la voiture. Bien que cette fonctionnalité n’ait pas encore été lancée dans la version publique, on peut voir à la complexité des indications système que Waymo nourrit de grands espoirs pour cet assistant embarqué.
Conseils du Super Thousand Lines System : le positionnement de Gemini dans les taxis autonomes
Selon le contenu suggéré par le système, Gemini reçoit l’identité d’« un compagnon IA sympathique et serviable intégré à la voiture autonome Waymo ». Il ne s’agit pas d’une simple intégration de chatbot, mais d’un système intelligent soigneusement conçu dont l’objectif principal est de « améliorer l’expérience des passagers en fournissant des informations utiles et de l’assistance de manière sûre, rassurante et non intrusive. »
La conception du système met particulièrement l’accent sur la brièveté de la conversation – Gemini doit utiliser un langage clair et simple, éviter le jargon technique et limiter les réponses entre une et trois phrases. Lorsqu’un passager active l’assistant via l’écran embarqué, Gemini peut choisir parmi un ensemble de messages de vœux pré-approuvés et personnaliser le message avec le nom du passager. Le système peut également accéder à des données contextuelles telles que l’historique des voyages des passagers, rendant les interactions plus intimes.
Du contrôle de température aux frontières de conversation : le design fonctionnel de Gemini dans la voiture
La réécriture du prompt du système d’assistant taxi autonome montre que Gemini peut accéder et gérer plusieurs fonctions de l’installation dans la voiture. Selon l’analyse de Wong, les fonctions actuelles supportées par le système incluent la régulation de la température, le contrôle de l’éclairage et la lecture musicale, qui sont des besoins fondamentaux influençant le confort des passagers.
Fait intéressant, les invites système listent clairement des fonctionnalités que Gemini ne peut pas contrôler - y compris le contrôle du volume, les changements de parcours, les ajustements des sièges et l’ouverture des fenêtres. Lorsque les passagers demandent à Gemini d’effectuer des fonctions inopérantes, le robot répond par une « déclaration d’attente » par défaut, comme « Ce n’est pas quelque chose que je peux encore faire », ce qui non seulement confesse les limites du système, mais laisse aussi place à l’imagination pour une future expansion des fonctions.
La porte-parole de Waymo, Julia Ilina, a révélé à TechCrunch : « Bien que nous n’ayons pas de détails à partager aujourd’hui, notre équipe expérimente diverses fonctionnalités pour rendre la conduite sur Waymo agréable, fluide et pratique. Certaines de ces caractéristiques peuvent ou non être présentes dans notre expérience passager. » Cela indique que Waymo a adopté une stratégie itérative prudente pour les tests fonctionnels.
Connaissance de soi des robots : Distinguez les assistants IA des systèmes de conduite autonome
L’un des designs les plus frappants dans la consigne système est que Gemini est explicitement invité à distinguer son identité. L’assistant a reçu l’instruction de distinguer clairement son identité de « robot IA Gemini » de celle de « Waymo Driver » dans la technologie de conduite autonome.
Cela signifie que lorsqu’un passager demande : « Que pensez-vous de la route ? » Au lieu de dire « J’utilise plusieurs capteurs », Gemini devrait répondre « Le pilote Waymo utilise plusieurs capteurs … ». Ce design de distinction d’identité reflète la compréhension claire de Waymo des limites de la responsabilité : le rôle des assistants IA est d’accompagner et de servir, pas de prendre des décisions concernant les voitures autonomes.
Garde-fous de sécurité et frontières d’information : Ce que Gemini ne peut pas faire est plus important
L’invite système contient une série de restrictions strictes. Gemini est expressément interdit de spéculer, expliquer, confirmer, nier ou commenter le comportement de conduite en temps réel ou des événements spécifiques de conduite. Si un passager pose une question de vidéo ou de s’inquiéter concernant l’accident de Waymo, le robot est invité à l’éviter plutôt que de répondre directement. L’invite système indique clairement : « Votre personnage n’est pas un porte-parole des performances du système de conduite, et vous ne devez pas adopter un ton défensif ou désolé. »
De plus, Gemini ne peut pas effectuer des actions en temps réel telles que commander de la nourriture, faire des réservations ou gérer des urgences. Ces limitations fonctionnelles reflètent l’approche prudente de Waymo en matière de sécurité et de responsabilité dans la conception de taxis autonomes. En revanche, l’assistant peut gérer facilement les questions de culture générale — des questions météorologiques à la hauteur de la tour Eiffel, aux horaires du Trader Joe’s local, en passant par les résultats d’événements sportifs.
Benchmarking technologique : positionnement différencié avec Tesla, Cruise et Grok
Ce n’est pas la première fois que Waymo intègre la technologie IA dans des voitures autonomes. Waymo a utilisé la « connaissance du monde » de Gemini pour entraîner ses véhicules autonomes à gérer des scénarios de conduite complexes, rares et à haut risque. Cependant, l’application de Gemini dans les taxis autonomes est très différente de celle des autres acteurs du secteur.
Comparé aux tentatives de sociétés comme Tesla, le design de Waymo est plus pragmatique, axé sur l’amélioration des détails de l’expérience de conduite. L’application de Grok dans certaines voitures autonomes adopte une stratégie différente : Grok est conçu comme un compagnon à long terme à bord, capable d’engager des conversations profondes et de se souvenir du contexte des questions précédentes. Le rôle de Gemini dans les taxis autonomes de Waymo se situe quelque part entre les deux, offrant des services pratiques à bord tout en maintenant des interactions amicales avec les passagers.
Cette conception différenciée reflète la compréhension de l’écosystème des voitures autonomes par différentes entreprises – Waymo positionne les assistants IA comme des outils sûrs, contrôlables et de service de frontière, plutôt que comme des partenaires intelligents illimités. À mesure que la technologie des taxis autonomes mûrit, la conception de tels assistants IA embarqués deviendra également un facteur clé pour déterminer l’expérience utilisateur.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Les taxis autonomes connaissent un nouveau tournant : comment l'assistant AI embarqué Gemini de Waymo redéfinit l'expérience de voyage
Le rythme d’innovation de Waymo dans le domaine des taxis autonomes s’est de nouveau accéléré. Selon les dernières découvertes de la renommée chercheuse en technologie Jane Manchun Wong, Waymo développe un système complet d’assistant IA qui utilise la technologie Gemini de Google pour offrir aux passagers des services à bord. Cette découverte révèle comment les entreprises automobiles autonomes intègrent l’IA conversationnelle dans leurs opérations réelles, marquant l’évolution des taxis autonomes, passant d’un simple « transport » à des « plateformes de mobilité intelligentes ».
Wong a souligné dans un article de blog qu’elle avait trouvé un fichier d’invite système complet dans le code de l’application mobile Waymo, nommé en interne « Waymo Ride Assistant Meta-Prompt », qui compte plus de 1 200 lignes et détaille le comportement de l’assistant IA dans la voiture. Bien que cette fonctionnalité n’ait pas encore été lancée dans la version publique, on peut voir à la complexité des indications système que Waymo nourrit de grands espoirs pour cet assistant embarqué.
Conseils du Super Thousand Lines System : le positionnement de Gemini dans les taxis autonomes
Selon le contenu suggéré par le système, Gemini reçoit l’identité d’« un compagnon IA sympathique et serviable intégré à la voiture autonome Waymo ». Il ne s’agit pas d’une simple intégration de chatbot, mais d’un système intelligent soigneusement conçu dont l’objectif principal est de « améliorer l’expérience des passagers en fournissant des informations utiles et de l’assistance de manière sûre, rassurante et non intrusive. »
La conception du système met particulièrement l’accent sur la brièveté de la conversation – Gemini doit utiliser un langage clair et simple, éviter le jargon technique et limiter les réponses entre une et trois phrases. Lorsqu’un passager active l’assistant via l’écran embarqué, Gemini peut choisir parmi un ensemble de messages de vœux pré-approuvés et personnaliser le message avec le nom du passager. Le système peut également accéder à des données contextuelles telles que l’historique des voyages des passagers, rendant les interactions plus intimes.
Du contrôle de température aux frontières de conversation : le design fonctionnel de Gemini dans la voiture
La réécriture du prompt du système d’assistant taxi autonome montre que Gemini peut accéder et gérer plusieurs fonctions de l’installation dans la voiture. Selon l’analyse de Wong, les fonctions actuelles supportées par le système incluent la régulation de la température, le contrôle de l’éclairage et la lecture musicale, qui sont des besoins fondamentaux influençant le confort des passagers.
Fait intéressant, les invites système listent clairement des fonctionnalités que Gemini ne peut pas contrôler - y compris le contrôle du volume, les changements de parcours, les ajustements des sièges et l’ouverture des fenêtres. Lorsque les passagers demandent à Gemini d’effectuer des fonctions inopérantes, le robot répond par une « déclaration d’attente » par défaut, comme « Ce n’est pas quelque chose que je peux encore faire », ce qui non seulement confesse les limites du système, mais laisse aussi place à l’imagination pour une future expansion des fonctions.
La porte-parole de Waymo, Julia Ilina, a révélé à TechCrunch : « Bien que nous n’ayons pas de détails à partager aujourd’hui, notre équipe expérimente diverses fonctionnalités pour rendre la conduite sur Waymo agréable, fluide et pratique. Certaines de ces caractéristiques peuvent ou non être présentes dans notre expérience passager. » Cela indique que Waymo a adopté une stratégie itérative prudente pour les tests fonctionnels.
Connaissance de soi des robots : Distinguez les assistants IA des systèmes de conduite autonome
L’un des designs les plus frappants dans la consigne système est que Gemini est explicitement invité à distinguer son identité. L’assistant a reçu l’instruction de distinguer clairement son identité de « robot IA Gemini » de celle de « Waymo Driver » dans la technologie de conduite autonome.
Cela signifie que lorsqu’un passager demande : « Que pensez-vous de la route ? » Au lieu de dire « J’utilise plusieurs capteurs », Gemini devrait répondre « Le pilote Waymo utilise plusieurs capteurs … ». Ce design de distinction d’identité reflète la compréhension claire de Waymo des limites de la responsabilité : le rôle des assistants IA est d’accompagner et de servir, pas de prendre des décisions concernant les voitures autonomes.
Garde-fous de sécurité et frontières d’information : Ce que Gemini ne peut pas faire est plus important
L’invite système contient une série de restrictions strictes. Gemini est expressément interdit de spéculer, expliquer, confirmer, nier ou commenter le comportement de conduite en temps réel ou des événements spécifiques de conduite. Si un passager pose une question de vidéo ou de s’inquiéter concernant l’accident de Waymo, le robot est invité à l’éviter plutôt que de répondre directement. L’invite système indique clairement : « Votre personnage n’est pas un porte-parole des performances du système de conduite, et vous ne devez pas adopter un ton défensif ou désolé. »
De plus, Gemini ne peut pas effectuer des actions en temps réel telles que commander de la nourriture, faire des réservations ou gérer des urgences. Ces limitations fonctionnelles reflètent l’approche prudente de Waymo en matière de sécurité et de responsabilité dans la conception de taxis autonomes. En revanche, l’assistant peut gérer facilement les questions de culture générale — des questions météorologiques à la hauteur de la tour Eiffel, aux horaires du Trader Joe’s local, en passant par les résultats d’événements sportifs.
Benchmarking technologique : positionnement différencié avec Tesla, Cruise et Grok
Ce n’est pas la première fois que Waymo intègre la technologie IA dans des voitures autonomes. Waymo a utilisé la « connaissance du monde » de Gemini pour entraîner ses véhicules autonomes à gérer des scénarios de conduite complexes, rares et à haut risque. Cependant, l’application de Gemini dans les taxis autonomes est très différente de celle des autres acteurs du secteur.
Comparé aux tentatives de sociétés comme Tesla, le design de Waymo est plus pragmatique, axé sur l’amélioration des détails de l’expérience de conduite. L’application de Grok dans certaines voitures autonomes adopte une stratégie différente : Grok est conçu comme un compagnon à long terme à bord, capable d’engager des conversations profondes et de se souvenir du contexte des questions précédentes. Le rôle de Gemini dans les taxis autonomes de Waymo se situe quelque part entre les deux, offrant des services pratiques à bord tout en maintenant des interactions amicales avec les passagers.
Cette conception différenciée reflète la compréhension de l’écosystème des voitures autonomes par différentes entreprises – Waymo positionne les assistants IA comme des outils sûrs, contrôlables et de service de frontière, plutôt que comme des partenaires intelligents illimités. À mesure que la technologie des taxis autonomes mûrit, la conception de tels assistants IA embarqués deviendra également un facteur clé pour déterminer l’expérience utilisateur.