Resumen de AN ALGORITHM TO OBTAIN AN OPTIMAL STRATEGY FOR THE MARKOV DECISION PROCESSES, WITH PROBABILITY DISTRIBUTION FOR THE PLANNING HORIZON.

español
En este trabajo formulamos un Proceso de Decisión Markoviano con Horizonte Aleatorio. Desarrollamos la ecuación de optimalidad para este problema, sin embargo puede no existir estrategias optimales estacionarias. Para el MDP (Proceso de Decisión Markoviano), con distribución de probabilidad para horizonte de planeamiento con soporte infinito, demostramos el Teorema de Horizonte de Planeamiento de Turnpike. Desarrollamos un algoritmo para obtener una decisión de primera etapa optimal. Damos algunos ejemplos numéricos.
English
In this paper we formulate Markov Decision Processes with Random Horizon. We show the optimality equation for this problem, however there may not exist optimal stationary strategies. For the MDP (Markov�Decision�Process), with probability distribution for the planning horizon with infinite support, we show Turnpike Planning Horizon Theorem. We develop an algorithm obtaining an optimal first stage decision. We give some numerical examples.

Acceso de usuarios registrados

¿Es nuevo? Regístrese

Coordinado por: