El coche autónomo recibe un nuevo impulso: cómo el asistente AI a bordo Gemini de Waymo está redefiniendo la experiencia de viaje

robot
Generación de resúmenes en curso

El ritmo de innovación de Waymo en el campo de los taxis autónomos se ha acelerado de nuevo. Según los últimos descubrimientos de la reconocida investigadora tecnológica Jane Manchun Wong, Waymo está desarrollando un sistema completo de asistente de IA que utiliza la tecnología Gemini de Google para ofrecer servicios a los pasajeros a bordo del vehículo. Este descubrimiento revela cómo las compañías de coches autónomos están integrando la IA conversacional en sus operaciones reales, marcando la evolución de los taxis autónomos de simples “transporte” a “plataformas inteligentes de movilidad”.

Wong señaló en una entrada de blog que encontró un archivo completo de prompt del sistema en el código de la aplicación móvil de Waymo, internamente con el nombre en clave “Waymo Ride Assistant Meta-Prompt”, que tiene más de 1.200 líneas y detalla el comportamiento del asistente de IA en el coche. Aunque esta función aún no se ha lanzado en la versión pública, se puede ver por la complejidad de los avisos del sistema que Waymo tiene grandes esperanzas en este asistente a bordo.

Consejos del sistema Super Thousand Lines: El posicionamiento de Gemini en taxis autónomos

Según el contenido solicitado por el sistema, Gemini recibe la identidad de “un compañero de IA amigable y servicial integrado en el coche autónomo Waymo.” No se trata de una simple integración de chatbots, sino de un sistema inteligente cuidadosamente diseñado con el objetivo principal de “mejorar la experiencia del pasajero proporcionando información útil y asistencia de forma segura, tranquilizadora y no intrusiva.”

El diseño del sistema enfatiza especialmente la brevedad de la conversación: Géminis debe usar un lenguaje claro y sencillo, evitar jerga técnica y mantener las respuestas entre una y tres frases. Cuando un pasajero activa el asistente a través de la pantalla del coche, Gemini puede elegir entre un conjunto de saludos preaprobados y personalizar el saludo con el nombre del pasajero. El sistema también puede acceder a datos contextuales como el historial de viaje de los pasajeros, haciendo que las interacciones sean más cercanas.

Desde el control de temperatura hasta los límites de conversación: el diseño funcional de Gemini en el coche

El aviso reescrito del sistema de asistencia de taxi autónomo muestra que Gemini puede acceder y gestionar múltiples funciones de la instalación en el coche. Según el análisis de Wong, las funciones actuales que soporta el sistema incluyen la regulación de temperatura, el control de la iluminación y la reproducción de música, que son necesidades básicas que afectan al confort de los pasajeros.

Curiosamente, las indicaciones del sistema enumeran claramente características que Gemini no puede controlar, incluyendo el control de volumen, cambios de ruta, ajustes de asientos y apertura de ventanas. Cuando los pasajeros piden a Gemini que realice funciones inoperables, el robot responde con una “declaración de expectativa” por defecto, como “Esto no es algo que pueda hacer todavía”, que no solo confiesa los límites del sistema, sino que también deja espacio para la imaginación para futuras expansiones de funciones.

La portavoz de Waymo, Julia Ilina, reveló a TechCrunch: “Aunque hoy no tenemos detalles que compartir, nuestro equipo ha estado experimentando con varias funciones para que conducir en Waymo sea agradable, fluido y práctico. Algunas de estas características pueden o no estar presentes en nuestra experiencia de pasajero.” Esto indica que Waymo ha adoptado una estrategia iterativa cautelosa para las pruebas funcionales.

Autoconciencia de los robots: Distingue entre asistentes de IA y sistemas autónomos

Uno de los diseños más llamativos en el prompt del sistema es que se le pide explícitamente a Gemini que distinga su identidad. Se instruyó al asistente para distinguir claramente entre su identidad como “robot IA Gemini” y su identidad como “Conductor Waymo” en tecnología de conducción autónoma.

Esto significa que cuando un pasajero pregunta: “¿Qué opinas de la carretera?” En lugar de decir, “Uso múltiples sensores”, Gemini debería responder “Waymo Driver usa múltiples sensores…”. Este diseño de distinción de identidad refleja la clara comprensión de Waymo sobre los límites de la responsabilidad: el papel de los asistentes de IA es acompañar y servir, no tomar decisiones sobre coches autónomos.

Barreras de seguridad y límites de información: Lo que Gemini no puede hacer es más importante

El prompt del sistema contiene una serie de restricciones estrictas. Gemini tiene expresamente prohibido especular, explicar, confirmar, negar o comentar sobre comportamientos de conducción en tiempo real o eventos específicos de conducción. Si un pasajero pregunta por un vídeo o una preocupación sobre el accidente de Waymo, se indica al robot que lo evite en lugar de responder directamente. El aviso del sistema indica claramente: “Tu personaje no es un portavoz del rendimiento del sistema de conducción, y no debes adoptar un tono defensivo o apologético.”

Además, Gemini no puede realizar acciones en tiempo real como pedir comida, hacer reservas o gestionar emergencias. Estas limitaciones funcionales reflejan el enfoque cauteloso de Waymo respecto a la seguridad y la responsabilidad en el diseño de taxis autónomos. En cambio, el asistente puede responder preguntas de cultura general con facilidad: desde consultas meteorológicas hasta la altura de la Torre Eiffel, el horario del Trader Joe’s local y los resultados de eventos deportivos.

Benchmarking tecnológico: posicionamiento diferenciado con Tesla, Cruise y Grok

No es la primera vez que Waymo integra tecnología de IA en coches autónomos. Waymo ha utilizado el “conocimiento del mundo” de Gemini para entrenar sus vehículos autónomos y ayudar a manejar escenarios de conducción complejos, raros y de alto riesgo. Sin embargo, la aplicación de Gemini en taxis autónomos es significativamente diferente de las prácticas de otros actores del sector.

En comparación con los intentos de empresas como Tesla, el diseño de Waymo es más pragmático, centrado en mejorar los detalles de la experiencia de conducción. La aplicación de Grok en algunos coches autónomos adopta una estrategia diferente: Grok está diseñado como un compañero a largo plazo dentro del coche, capaz de entablar conversaciones profundas y recordar el contexto de preguntas anteriores. El papel de Gemini en los taxis autónomos de Waymo se sitúa en un punto intermedio, proporcionando servicios prácticos dentro del coche mientras mantienen interacciones amistosas con los pasajeros.

Este diseño diferenciado refleja la comprensión que tienen las distintas empresas sobre el ecosistema de coches autónomos: Waymo posiciona a los asistentes de IA como herramientas seguras, controlables y de servicio de límites, en lugar de socios inteligentes ilimitados. A medida que la tecnología de taxis autónomos madura, el diseño de estos asistentes de IA a bordo también se convertirá en un factor diferenciador clave para determinar la experiencia del usuario.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)