Ayuda
Ir al contenido

Dialnet


Resumen de Active map learning for robots:insights into statistical consistency

Rubén Martínez Cantín

  • El problema de aprendizaje de entornos desconocidos en robótica móvilrecibe el nombre de SLAM (Simultaneous Localization andMapping). Si además el robot tiene que tornar decisiones en este ámbito se denomina SLAM activo o simplemente, exploración.Dada la naturaleza del problema, los métodos actuales de SLAM están basados en una fuerte formulación probabilista,en la forma defiltros Bayesianos. Extensiones de esta formulación en el ámbito de la toma de decisiones en entornos inciertos permiten resolver elproblema de forma activa y autónoma, usando, por ejemplo, MDPs (Markov Decision Processes).Por un lado, la enorme dimensionalidad (temporal, espacial y estadística) del problema de SLAM hace que, matemáticamente, noexista solución completa. Existen soluciones subóptimas presentadas en la literatura actual basadas en aproximaciones lineales deprimer orden, como el filtro de Kalman extendido (EKF) o métodos de muestreo, como el filtro de partículas Rao-Blackwellizado(RBPF), pero que sufren de cierta inconsistencia estadística que provoca resultados corruptos o totalmente erróneos alargo plazo. Porotro lado, esta enorme complejidad también implica que las técnicas actuales de MDPs -iteración de valor, iteración de política ybúsqueda de política con árboles o gradientes- solo aportan soluciones parciales o se reducen a problemas muy básicos y no realistas.En esta tesis se analizan las propiedades 'estadísticas del problema de SLAM y los algoritmos comúnmente empleados,especialmente las fuentes de error. En ese sentido, se investiga la aplicación de aproximaciones lineales de segundo orden como elfiltro de Kalman unscented (UKF), métodos de muestreo más avanzados, como el filtro de partículas marginal (MPF),o estimaciónbasada en aproximación estocástica. Estos algoritmosteóricamente mejoran la consistencia estadística de los anteriores, lo cual sedemuestra con los correspondientes experimentos. Por otro lado, se investigan nuevos algoritmos de búsqueda de políticas máseficientes que permitan solucionar el problema completo de decisión.En este sentido se trabaja con algoritmos de optimizaciónglobal eficiente para la búsqueda de políticas. Este trabajo esta relacionado con el aprendizaje activo de parámetros usando procesosGaussianos.La exploración inteligente de entornos desconocidos puede ampliar los campos de aplicación de la robótica, favoreciendo laintegración de los robots en la vida cotidiana. El objetivo final es la combinación de todos estos sistemas, de manera fiable y robustaen una plataforma autónoma que permita al. robot realizar tareas peligrosas o repetitivas, con poca o nula supervisión. De este modo,se consigue una mayor robustez frente a situaciones inesperadas y se suprime la necesidad de personal cualificado para su uso.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus