Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Descubrimiento de estructuras algebraicas ocultas mediante transformadores con haz con reconocimiento de rango GRPO

Created by
  • Haebom

Autor

Jaeha Lee, Gio Huh, Ning Su, Tony Yue YU

Describir

Este artículo explora la solución de problemas de descomposición polinómica multivariable mediante el modelo Transformer. La descomposición polinómica, si bien se aplica ampliamente en ciencia e ingeniería, es conocida por ser NP-hard y requiere alta precisión y perspicacia. Este estudio desarrolla un flujo de trabajo de generación de datos sintéticos que permite un control preciso de la complejidad del problema y entrena un modelo Transformer mediante aprendizaje supervisado para evaluar el comportamiento de escalamiento y el rendimiento de generalización. Además, proponemos la Optimización de Políticas Relativa Agrupada por Haz (BGRPO), un método de aprendizaje por refuerzo con jerarquía, adecuado para problemas algebraicos complejos. El ajuste fino mediante BGRPO mejora la precisión y reduce el ancho del haz hasta a la mitad, lo que reduce la carga de trabajo de inferencia en aproximadamente un 75 %. Además, el modelo propuesto supera a Mathematica en la simplificación polinómica.

Takeaways, Limitations

Takeaways:
Demostramos que el modelo Transformer se puede aplicar al descubrimiento de patrones latentes no lineales y a la descomposición polinomial multivariada, que es un problema NP-hard.
Presentamos un método para reducir eficientemente la cantidad de cálculo de inferencia a través del algoritmo BGRPO.
Logra un rendimiento superior al Mathematica tradicional en tareas de simplificación de polinomios.
Proporciona un canal de generación de datos sintéticos que puede controlar la complejidad de los problemas de descomposición polinomial.
Limitations:
Las evaluaciones de desempeño se han realizado principalmente en datos sintéticos, y el desempeño de generalización en datos reales requiere verificación adicional.
El rendimiento del algoritmo BGRPO puede depender del tipo de problema específico y de la configuración.
El rendimiento en polinomios muy complejos requiere más estudios.
👍