Este artículo analiza los métodos de aprendizaje por refuerzo de disparo cero (RL de disparo cero) que pueden aplicarse a problemas del mundo real. El RL de disparo cero busca generalizarse a nuevas tareas o dominios sin necesidad de entrenamiento. El artículo presenta un método para abordar las limitaciones de los datos del mundo real (calidad, observabilidad y disponibilidad de los datos), identifica las limitaciones de los métodos existentes y propone nuevas técnicas para mejorarlos.