Aprendizaje por refuerzo para la toma de decisiones seguras en dominios con espacios de estados y acciones continuos

Aquesta tesi apareix a les col·leccions següents