Hacia un sistema de decisión intuitivo en los vehículos automatizados  
Jorge Villagrá

RESUMEN


El paradigma de la movilidad a demanda cambiará radicalmente la manera de desplazarse de las personas, pero hemos de ser conscientes de que la automatización completa no es necesariamente la solución más realista (al menos a corto/medio plazo). En ese contexto, la correcta interacción entre la máquina, el conductor y los demás agentes de la carretera será decisiva, y por tanto una de las áreas de desarrollo en las que habrá que invertir más para conseguir aumentar la confianza de los usuarios. Será por tanto necesario el desarrollo y la validación de nuevos sistemas de decisión artificiales intuitivos que permitan avanzar hacia el despliegue masivo de vehículos automatizados seguros, fiables y predecibles.

ABSTRACT


The paradigm of mobility on demand will radically change the way people move, but we must be aware that complete automation is not necessarily the most realistic solution (at least in the short / medium term). In this context, the correct interaction between the machine, the driver and the other agents of the road will be decisive, and therefore one of the areas of development in which more resources will have to be invested to increase users confidence. It will therefore be necessary to develop and validate new artificial intuitive decision systems that allow us to move towards mass deployment of safe, reliable and predictable automated vehicles.

Aunque hoy oímos hablar de la conducción autónoma con naturalidad y en contextos variados, sólo hace 8 años que Waymo, heredero del programa de coche autónomo de Google, comenzó a invertir en esta tecnología, y agitar así de manera decisiva el mercado automovilístico, tradicionalmente conservador en la adopción de nuevas tecnologías.

La historia de los vehículos autónomos es muy limitada en el tiempo, y aunque existe constancia de material publicitario en los años 40 [I] o de prototipos rudimentarios en los 70 [II], el fin de la prehistoria de la conducción autónoma se suele ubicar en torno a los Darpa Challenge que organizó el Departamento de Defensa de EEUU en los años 2004 y 2005. En ellos, se propuso que vehículos sin conductor fuesen capaces de ir de un punto A a otro B separados más de 200 km. a través del desierto de Mojave (California). En la primera edición, ningún equipo fue capaz de hacer en modo autónomo más de 12 km, a pesar del costosísimo equipamiento que embarcaban los vehículos que participaban. Un año después, fueron cuatro los que consiguieron culminar con éxito el reto, probando así el potencial de la tecnología y empezando a esbozar las áreas de mejora necesarias para un posible despliegue comercial. De hecho, los responsables del equipo ganador de esa edición y de una posterior, que se llevó a cabo en un entorno urbano, fueron poco después las 2 cabezas más visibles de Google Car, Sebastian Thrun y Chris Urmson.

Desde entonces, los acontecimientos se han ido precipitando y todo un ecosistema de empresas pequeñas, medianas y grandes se han ido incorporando a un mercado en el que los actores tradicionales han tenido que irse adaptando a los nuevos modelos de negocio y a los avances tecnológicos. Así, hoy hablamos tanto del automóvil como producto y de su cadena de suministro clásica, como de los conceptos emergentes asociados a la movilidad a demanda, incorporando modelos de consumo colaborativo y ciertas capacidades de autonomía.

En relación a la mal llamada autonomía de las soluciones existentes, es necesario distinguir entre los diferentes niveles estipulados por la Sociedad de Ingenieros Americanos (SAE), [III]. En este estándar se distinguen 6 niveles diferentes de automatización que van desde el 0 -en el que lo único que se hace es alertar al conductor- hasta el 5 -en el que el vehículo es capaz de gestionar de manera autónoma e independiente cualquier escenario de conducción.





Ha habido mucha controversia alrededor de esta clasificación por la asunción implícita de que, a mayor nivel, mayor complejidad de implantación. Sin embargo, a partir del nivel 3 todos los niveles implican la auto-supervisión del sistema artificial, y por tanto, la delegación de responsabilidades del hombre sobre la máquina. Esta consideración provoca importantes retos legislativos, pero también técnicos. En el propio nivel 3, la inteligencia artificial del vehículo tiene que ser capaz de anticipar posibles problemas para la gestión segura de la escena de conducción, y cederle al conductor el control con suficiente tiempo de antelación. Como los estudios nos dicen [IV] que un humano medio puede tardar hasta 15 segundos en poner máxima atención en la conducción si parten de una tarea completamente desligada a esta (leer, conversar sin mirar al frente…), resulta extremadamente complicado implementar niveles 3 de automatización seguros y fiables en cualquier entorno.

En el nivel 4 el vehículo no tiene ninguna interacción con el humano, con lo que los mandos clásicos -volante, acelerador, freno- no son ni siquiera necesarios. La única diferencia entre este nivel de automatización y el nivel 5 es que los primeros son sólo operativos en un entorno acotado y con cierto grado de estructuración -lanzaderas en aeropuertos, valet parking automático, auto-pilotos en autopistas.

Toda la industria está hoy centrada en el desarrollo de soluciones fiables que respondan a las características definidas de los niveles 3 y 4. Sin embargo, no hay consenso sobre cuál es la mejor manera de aproximarse al mercado. Ni por la facilidad de adopción de la tecnología en cada caso ni, sobre todo, por la dificultad técnica de cada una de ellas: en el primer caso, por la necesidad de un mecanismo fiable de previsión de evolución de vehículos y peatones a medio/largo plazo en entornos complejos; en el segundo, por la robustez necesaria de la percepción y la toma de decisiones artificiales a cualquier evento posible.

De manera general, las barreras actuales para conseguir un despliegue y adopción masivas de la tecnología se pueden agrupar en seis grandes grupos:

1. Legislación: aún muy dependiente de las limitaciones de la Convención de Viena [V], que establece la necesidad de tener un ser humano al frente del vehículo para desarrollar la tarea de conducción. Aunque se está trabajando en una relajación de esa exigencia, aparece un problema adicional con las nuevas regulaciones: la falta de coherencia entre territorios y las dificultades que eso genera en las operaciones transfronterizas. Además, asuntos candentes en otros dominios tecnológicos como la protección de los datos personales asociados a la conducción o como la ciberseguridad de los vehículos conectados son y serán objeto de estudio en los próximos años.

2. Aspectos éticos: aunque la importancia del dilema del tranvía [VI] se ha sobre-dimensionado en los últimos tiempos y la tecnología está aún lejos de poder permitirse decidir el tipo y número de personas a las que conviene salvar, es necesario establecer un protocolo de medidas sobre la ética de la toma de decisiones artificial que embarcarán los vehículos. El objetivo que se persigue será homogeneizar ciertas medidas ante eventos concretos similares para facilitar la “accountability” [VII] del sistema artificial.

3. Coste: a pesar de que aún existen sensores que hoy son prohibitivos -los Lidares cuestan todavía decenas de miles de euros- y el consumidor no parece dispuesto a pagar más de 4.000€ suplementarios por esta tecnología [VIII], la mejora en las técnicas y procesos de fabricación y la producción en grandísimas series harán que, a medio plazo, esta barrera sea la menos costosa de franquear.

4. Interacción hombre-máquina: mientras se apueste por un nivel 3 de autonomía, la manera en que el conductor y el vehículo se relacionen es crítica. En torno al 95% de los accidentes de tráfico tienen su origen en el ser humano [IX], pero ninguna máquina ha sido capaz aún de igualar las capacidades humanas en relación a la capacidad de abstracción, de generalización o de razonamiento simbólico. Así las cosas, neurociencia e inteligencia artificial tendrán que trabajar de la mano para que, de algún modo, podamos converger hacia una solución segura y eficaz.

5. Robustez a condiciones muy variables: la variabilidad de situaciones de conducción a la que nos enfrentamos es extremadamente alta, casi imposible de prever y en consecuencia, de recrear en entornos simulados. En efecto, a pesar de los increíbles avances de las técnicas de aprendizaje automático en los últimos años, aún no somos capaces de hacerles aprender de eventos raros sobre los que no tienen información, y ahí radica una de las principales dificultades del uso de técnicas de end-to-end deep learning (caja negra que en ningún caso puede aspirar a una IA fuerte [X]).

6. Validación y certificación de la seguridad del sistema artificial: aún en el hipotético caso de que los sistemas anteriormente descritos fuesen capaces de responder de manera segura a cualquier situación que se les plantee, todavía hoy no sabemos cómo validar correctamente esos componentes. Así pues, tenemos ante nosotros un largo recorrido hasta que podamos definir estándares que permitan certificar la conformidad de los sistemas con respecto a un nivel de seguridad dado, de manera análoga a como se hace hoy con funciones sencillas en el coche (e.g. elevalunas eléctrico) o en cualquier dispositivo embarcado en un avión.


Los tres primeros retos, de naturaleza socio-económica, sólo podrán atacarse si la tecnología es capaz de aportar soluciones convincentes a los tres siguientes, de carácter más técnico. En torno a estos últimos desafíos existe un área de investigación y desarrollo esencial para poder acometerlos: la toma de decisiones artificial y su combinación armoniosa con la humana. En efecto, la complejidad de algunos escenarios de conducción en entornos urbanos, muy dinámicos y con gran incertidumbre, sugieren que la automatización completa puede tener límites en su uso. Esa complejidad se puede visualizar desde diferentes puntos de vista. Basta con recordar imágenes aéreas de la Place de l’Étoile en Paris o aún peor, escenas de tráfico de un día cualquiera en Bombay, Manila o Saigón. Otro aspecto que refleja el nivel de dificultad de desarrollo y validación que un sistema artificial de esta naturaleza lleva asociado es el número de líneas de código del software que lo gobierna: un Boeing 787 tiene en torno a los 5 millones de líneas de código; un coche de alta gama hoy tiene alrededor de los 100 millones de líneas de código, y se estima que un coche nivel 4/5 puede llegar a los 250 millones de líneas de código, lo que hace su control en tiempo real extremadamente complicado.

Parece claro pues que la automatización completa de la conducción tiene hoy limites, dado lo extremadamente complicado que resulta predecir con precisión cualquier posible escenario, y particularmente si se encuentra en entornos urbanos. Esas limitaciones se explican fundamentalmente por el hecho de que la inteligencia artificial desarrollada hasta la fecha, mayoritariamente no explicable [XI], es aún muy frágil ante hipótesis no formuladas. Así las cosas, la automatización de la conducción en el corto y medio plazo debería entenderse como un mecanismo para extender las capacidades humanas, y no para remplazarlas completamente. En este sentido, es importante entender la necesaria personalización de esa automatización, ya que un conductor humano conduce de manera diferente dependiendo de su objetivo, de sus habilidades y de su experiencia.

El apoyo ideal para estas necesidades sería un sistema que entienda nuestras intenciones, conozca nuestras habilidades y dé apoyo de manera transparente cuando hace falta a diferentes niveles, siguiendo el ejemplo de la simbiosis existente entre jinete y caballo, riding horse metaphor, [XII]. El objetivo sería por tanto encontrar un sistema de inspiración cognitiva que, a partir de una comprensión inicial, incierta e imprecisa del entorno de conducción, sea capaz de:.

• Dejar el control al conductor e interviniendo cuando se subestime el riesgo de una situación o se tome una mala decisión por falta de percepción (Nivel 1/2) • Ejecutar de manera “autónoma” una manobra iniciada (Nivel 2) • Ejecutar una tarea de alto nivel (Nivel 3/4) cuando conductor, sensores y entorno lo permitan.

Y que, además, sea capaz de adaptarse a lo largo del tiempo a las condiciones cambiantes de la conducción sobre entornos a priori similares; y que entienda, aprenda y corrija los malos hábitos del conductor humano.

El programa AUTOPIA del Consejo Superior de Investigaciones Científicas surge hace 15 años con la intención de mitigar las limitaciones potenciales de una conducción totalmente autónoma a través del control compartido humano-máquina y de la cooperación con otros agentes de carreteras. AUTOPIA tiene una sólida experiencia en la provisión de inteligencia a vehículos automatizados y conectados en situaciones específicas donde las habilidades de comunicación e interacción pueden permitir resolver los dilemas de comprensión-decisión de automóviles autónomos aislados. El grupo tiene un interés creciente en las arquitecturas de toma de decisiones donde las intenciones y habilidades de los conductores pueden ser adoptadas en diferentes niveles de asistencia (de Nivel 2 a Nivel 4 SAE). En este sentido, la influencia de la percepción, la localización y el mapeado en la toma de decisiones y en las interacciones con la carretera son las cuestiones centrales que articulan la actividad científica del programa.

Las emisiones contaminantes de los vehículos de motor se controlan desde su fabricación, por lo que todos los vehículos deben aprobarse de acuerdo con pruebas de laboratorio y estándares europeos (Euro Standards) antes de comercializarlos. Sin embargo, la realidad es que estas pruebas se realizan “en banco", dentro de ciclos de conducción específicos y sin pruebas de circuito. Por lo tanto, las emisiones de conducción reales de los vehículos en áreas urbanas difieren habitualmente de los datos oficiales. La Universidad de Virginia en Estados Unidos (caso Dieselgate) y la Agencia Medioambiental Europea (Figura 3) han publicado resultados de investigaciones realizada en este campo, demostrando la diferencia significativa entre las emisiones declaradas por el fabricante y las reales generadas cuando el vehículo está en la carretera.

El objetivo último de AUTOPIA es desarrollar un sistema de decisión intuitivo y seguro, tanto para los ocupantes de los vehículos como para los demás agentes que aparecen en la escena de conducción (vehículos conducidos por personas o por máquinas, ciclistas, motoristas, peatones…). Para poder acercarnos a esa meta ambiciosa y cuasi-utópica, hay varias preguntas que centran las decisiones de AUTOPIA: (i) ¿Podrá el conductor humano entender los cambios de comportamiento del vehículo?; (ii) ¿Podrán hacerlo las personas que hay fuera del propio vehículo? (iii) ¿Deben los coches conducir como los seres humanos? ¿O debemos aspirar a una versión mejorada de nosotros mismos? Y para ello (iv) ¿es necesario un control compartido entre el hombre y la máquina?

Las respuestas a estas cuestiones moldean todas las soluciones de diseño de AUTOPIA, que apuesta por una interacción variable entre el humano y el vehículo según el contexto de conducción, y dentro de ese marco, explora las necesidades humanas tanto dentro como fuera del vehículo.

Una relación satisfactoria entre conductor/pasajero y máquina ha de cumplir al menos las siguientes 4 premisas: (i) el conductor ha de tener la mejor comprensión posible de la situación (lo que en inglés llamamos situation awareness); (ii) hay que evitar la confusión de modos; es decir que cada agente sepa en todo momento quién tiene el control y cuándo va a soltarlo/recuperarlo; (iii) la usabilidad de la interfaz tiene que encontrar el difícil equilibrio entre capacidad informativa y sobrecarga cognitiva; (iv) hay que desarrollar estrategias que permitan minimizar la pérdida de habilidad asociada a la reducción excesiva de carga de trabajo.

Como la convivencia entre la máquina, el conductor y los demás agentes de la carretera se convierte en crítica, habrá que cuidar aspectos experienciales relativos al humano tanto dentro como fuera del vehículo. Por un lado, se necesitará que el humano tenga confianza en el sistema y sepa en todo momento comunicarse con él; que, según el contexto, pueda desarrollar actividades no ligadas a la conducción compatibles con el habitáculo del vehículo; y que cuando lo desee, pueda seguir disfrutando del placer de conducir. Por otro lado, mientras convivan los vehículos automatizados (en sus diferentes niveles) y los conducidos manualmente, y parece que ese periodo no será de menos de 20-25 años, será fundamental comunicarse de manera segura y eficiente con el resto de usuarios del espacio público. En efecto, la negociación visual que hoy hacen pasajeros y ciclistas con los conductores de vehículos en pasos de cebra, cruces o rotondas no podrá tener lugar con coches conducidos por máquinas. Así, la confianza en estos nuevos dispositivos sólo podrá crecer si mejoramos tanto la predictibilidad de comportamiento como la transparencia en la comunicación del sistema artificial con el viandante.



Conclusiones



A la vista de todo lo anterior, parece claro que el paradigma de la movilidad a demanda cambiará radicalmente la manera de desplazarse de las personas, pero hemos de ser conscientes de que la automatización completa no es necesariamente la solución más realista (al menos a corto/medio plazo). En ese contexto, la correcta interacción entre la máquina, el conductor y los demás agentes de la carretera será decisiva y, por tanto, una de las áreas de desarrollo en las que habrá que invertir más para conseguir aumentar la confianza de los usuarios. Por este motivo será necesario el desarrollo y la validación de un sistema de decisión artificial intuitivo que permita avanzar hacia el despliegue masivo de vehículos automatizados seguros, fiables y predecibles.



Bibliografía



[I] https://www.computerhistory.org/atchm/where-to-a-history-of-autonomous-vehicles/
[II] https://spectrum.ieee.org/cars-that-think/transportation/self-driving/the-electronic-highway-of-1969
[III] https://blog.ansi.org/2018/09/sae-levels-driving-automation-j-3016-2018/#gref
[IV] A. Eriksson, & N.A. Stanton, “Takeover time in highly automated vehicles: noncritical transitions to and from manual control”, Human factors, vol. 59, no. 4, pp. 689-705, 2017.
[V] https://www.dipublico.org/10838/convencion-sobre-la-circulacion-vial-viena-8-de-noviembre-de-1968/
[VI] N. J. Goodall, "Can you program ethics into a self-driving car?," in IEEE Spectrum, vol. 53, no. 6, pp. 28-58, June 2016.
[VII] https://www.besttechie.com/the-car-did-it-accountability-in-the-age-of-self-driving-cars/
[VIII] R.A. Daziano, M. Sarrias, and B. Leard, “Are consumers willing to pay to let cars drive for them? Analyzing response to autonomous vehicles”. Transportation Research Part C: Emerging Technologies, vol. 78, pp.150-164, 2017
[IX] http://www.dgt.es/Galerias/prensa/2018/01/Presentacion-balance-siniestralidad-2017-completo..pdf
[X] H. Xu, Y. Gao, F. Yu and T. Darrell, “End-to-end learning of driving models from large-scale video datasets”. arXiv preprint, 2017
[XI] https://www.darpa.mil/attachments/XAIProgramUpdate.pdf
[XII] M. Da Lio, F. Biral, E. Bertolazzi, M. Galvani, P. Bosetti, D. Windridge, A. Saroldi and F. Tango, “Artificial co-drivers as a universal enabling technology for future intelligent vehicles and transportation systems”. IEEE Transactions on intelligent transportation systems, vol. 16, no. 1, pp.244-263, 2015.