Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un algoritmo basado en la implementación y una función de recompensa para la asignación de recursos en procesos de negocio

Created by
  • Haebom

Autor

Jeroen Middelhuis, Zaharah Bukhsh, Ivo Adan, Remco Dijkman

Describir

Este artículo aborda el problema de asignación de recursos para minimizar el tiempo de ciclo y mejorar la eficiencia en los procesos de negocio. Destacamos las limitaciones de los métodos existentes basados ​​en aprendizaje de refuerzo profundo (DRL), que no son adecuados para entornos de negocio dinámicos y pueden aprender políticas subóptimas debido a desajustes entre las funciones objetivo y de recompensa. Para abordar estas limitaciones, proponemos un algoritmo de DRL basado en la implementación y una función de recompensa que refleja directamente el objetivo de minimización del tiempo de ciclo. El algoritmo propuesto mejora iterativamente las políticas mediante la evaluación de las rutas de ejecución en función de diversas acciones, eliminando la necesidad del diseño manual de la función de recompensa. Los resultados experimentales demuestran que el método propuesto aprende políticas óptimas en seis escenarios donde se pueden calcular políticas óptimas y que su rendimiento es igual o superior al de los mejores métodos heurísticos existentes en procesos de negocio a escala real.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo algoritmo de asignación de recursos basado en DRL adecuado para entornos de procesos de negocio dinámicos.
Resolver la dificultad del diseño de la función de recompensa mediante el diseño de una función de recompensa directamente relacionada con la función objetivo.
Demuestra un rendimiento superior o equivalente a los métodos existentes en procesos de negocio a escala realista.
Limitations:
Se necesita más investigación para determinar la escalabilidad del algoritmo propuesto y su rendimiento de generalización a procesos comerciales complejos.
Se necesita una validación experimental adicional para varios tipos de procesos de negocio.
Los resultados experimentales se limitan a escenarios en los que se pueden calcular políticas óptimas, lo que requiere una revisión más profunda para determinar su aplicabilidad a los procesos comerciales generales.
👍