En este trabajo formulamos un Proceso de Decisión Markoviano con Horizonte Aleatorio. Desarrollamos la ecuación de optimalidad para este problema, sin embargo puede no existir estrategias optimales estacionarias. Para el MDP (Proceso de Decisión Markoviano), con distribución de probabilidad para horizonte de planeamiento con soporte infinito, demostramos el Teorema de Horizonte de Planeamiento de Turnpike. Desarrollamos un algoritmo para obtener una decisión de primera etapa optimal. Damos algunos ejemplos numéricos.
In this paper we formulate Markov Decision Processes with Random Horizon. We show the optimality equation for this problem, however there may not exist optimal stationary strategies. For the MDP (Markov�Decision�Process), with probability distribution for the planning horizon with infinite support, we show Turnpike Planning Horizon Theorem. We develop an algorithm obtaining an optimal first stage decision. We give some numerical examples.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados