Ayuda
Ir al contenido

Dialnet


Resumen de Aprendizaje por demostración mediante datos sintéticos para tareas parametrizadas

Adrián Prados, Alicia Mora Velasco, Alberto Mendez, Luis Santiago Garrido Bullón, Ramón I. Barber Castaño

  • español

    El aprendizaje de tareas por demostración es una tarea desafiante. Uno de los principales desafíos es la extrapolación del conocimiento a partir de demostraciones del usuario. Generar un conjunto de situaciones diversas cubriendo todos los casos posibles es una tarea compleja. Por esto, surge la idea de utilizar la parametrización de tareas, que genera información relevante de puntos característicos de una tarea, permitiendo modelar una política con una menor cantidad de demostraciones. En este artículo, presentamos un algoritmo centrado en generar información sintética para la generalización de tareas parametrizadas. El algoritmo permite la generación autónoma de datos, produciendo demostraciones de características similares a las de los usuarios. Para ello, una métrica basada en la distancia de Wasserstein, que tiene en cuenta los datos probabilísticos de las trayectorias aprendidas, ha sido desarrollada. Se han realizado pruebas en simulación, comparando la eficiencia con dos algoritmos de Lfd y en un entorno real, para una tarea de barrido, realizada con el robot ADAM.

  • English

    Learning tasks by demonstration is a challenging task. One of the main challenges is extrapolating knowledge from userdemonstrations. Generating a diverse set of situations covering all possible cases is a complex task. Hence, the idea of usingtask parameterization arises, which generates relevant information about characteristic points of a task, allowing the modeling ofa policy with fewer demonstrations. In this paper, we present an algorithm focused on generating synthetic information for thegeneralization of parameterized tasks. The algorithm enables the autonomous generation of data, producing demonstrations withcharacteristics similar to those of users. For this purpose, a metric based on Wasserstein distance, which takes into account theprobabilistic data of the learned trajectories, has been developed. Tests have been conducted in simulation, comparing efficiencywith two LfD algorithms, and in a real environment, for a sweeping task, carried out with the ADAM robot.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus