Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico - Dialnet

Ir al contenido

Ayuda

Aprendizaje por refuerzo para sistemas lineales discretos con dinámica desconocida: simulación y aplicación a un sistema electromecánico

Autores: Henry Díaz Iza, Leopoldo Armesto Angel, Antonio Sala
Localización: Actas de las XXXVIII Jornadas de Automática / coord. por Hilario López García, 2017, ISBN 978-84-16664-74-0, págs. 360-367
Idioma: español
Enlaces
- Texto completo
Resumen
- El aprendizaje por refuerzo es una técnica que se utiliza en la búsqueda de soluciones en sistemas de decisión secuencial. Una gran parte de los algoritmos usados en el aprendizaje por refuerzo se fundamentan en la programación dinámica, se considera que el aprendizaje por refuerzo es una extensión de la programación dinámica que proporciona soluciones sin la necesidad de conocer el modelo de comportamiento del sistema. Estas técnicas combinan algunas características del control óptimo y control adaptativo para el diseño de controladores realimentados. Se describen los algoritmos básicos del aprendizaje por refuerzo para la implementación de soluciones en sistemas discretos deterministas. Finalmente, se realizaron pruebas prácticas de la implementación del algoritmo de aprendizaje Q-learning en un péndulo de un grado de libertad, con el objetivo de verificar si el algoritmo de aprendizaje converge y proporciona un controlador estabilizante.

Fundación Dialnet

Acceso de usuarios registrados

Imagen de identificación

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

© 2001-2024 Fundación Dialnet · Todos los derechos reservados

Coordinado por: