Periodo de publicación recogido
|
|
|
Uniform convergence of value iteration policies for discounted Markov decision processes
Daniel Cruz-Suárez, R. Montes de Oca
Boletín de la Sociedad Matemática Mexicana: Tercera Serie, ISSN 1405-213X, ISSN-e 2296-4495, Vol. 12, Nº. 1, 2006, págs. 133-148
Estimation and control in finite Markow decision processes with the average reward criterion
R. Montes de Oca , R. Cavazos Cadena
Applicationes mathematicae, ISSN 1233-7234, Vol. 31, Nº 2, 2004, págs. 127-154
Estimates for perturbations of general discounted Markov control chains
R. Montes de Oca , A. Sakhanenko , F. Salem Silva
Applicationes mathematicae, ISSN 1233-7234, Vol. 30, Nº 3, 2003, págs. 287-304
Estimates for perturbations of discounted Markov chains on general spaces
R. Montes de Oca , A. Sakhanenko , F. Salem Silva
Applicationes mathematicae, ISSN 1233-7234, Vol. 30, Nº 1, 2003, págs. 39-53
R. Montes de Oca , R. Cavazos Cadena
Applicationes mathematicae, ISSN 1233-7234, Vol. 28, Nº 1, 2001, págs. 93-109
R. Montes de Oca , R. Cavazos Cadena
Applicationes mathematicae, ISSN 1233-7234, Vol. 27, Nº 2, 2000, págs. 167-185
Esta página recoge referencias bibliográficas de materiales disponibles en los fondos de las Bibliotecas que participan en Dialnet. En ningún caso se trata de una página que recoja la producción bibliográfica de un autor de manera exhaustiva. Nos gustaría que los datos aparecieran de la manera más correcta posible, de manera que si detecta algún error en la información que facilitamos, puede hacernos llegar su Sugerencia / Errata.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados