Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Optimización multiobjetivo en el espacio de diseño de CPU: la atención es todo lo que necesitas

Created by
  • Haebom

Autor

Runzhen Xue, Hao Wu, Mingyu Yan, Ziheng Xiao, Guangyu Sun, Xiaochun Ye, Dongrui Fan

Describir

Este artículo presenta AttentionDSE, un novedoso marco de exploración del espacio de diseño (DSE) para el diseño de CPU en espacios de diseño de alta dimensión. Los marcos DSE existentes presentan problemas como la baja precisión y escalabilidad de los modelos sustitutos, la exploración ineficiente basada en heurísticas manuales o búsquedas exhaustivas, y dificultades de interpretación. AttentionDSE aborda estos problemas integrando predicciones de rendimiento y guía de diseño mediante una arquitectura de red neuronal basada en la atención. Los pesos de atención cumplen la doble función de estimar con precisión el rendimiento y, al mismo tiempo, exponer los cuellos de botella. Las innovaciones clave incluyen un mecanismo de atención basado en la percepción que aprovecha la jerarquía y la localidad (reduciendo la complejidad de $\mathcal{O}(n^2)$ a $\mathcal{O}(n)$) y el análisis de cuellos de botella basado en la atención, que sugiere automáticamente parámetros críticos para la optimización dirigida a objetivos. En una evaluación del espacio de diseño de CPU de alta dimensión utilizando el punto de referencia SPEC CPU2017, AttentionDSE logra un hipervolumen de Pareto hasta un 3,9 % mayor y un tiempo de búsqueda más del 80 % más rápido en comparación con los modelos de referencia de última generación.

Takeaways, Limitations

Takeaways:
Presentamos un marco novedoso, eficiente e interpretable para resolver problemas de DSE en espacios de diseño de alta dimensión.
Aprovechar el mecanismo de atención para integrar la predicción del rendimiento y la orientación del diseño, creando un ciclo de optimización eficiente.
Reducción de la complejidad computacional y eliminación de la dependencia heurística específica del dominio a través de la atención impulsada por la percepción y el análisis de cuellos de botella consciente de la atención.
Los resultados experimentales verifican la eficacia de mejorar el Hipervolumen de Pareto y reducir el tiempo de búsqueda.
Limitations:
Actualmente, el marco está especializado para el diseño de CPU y se necesita más investigación para determinar su generalización a otros espacios de diseño.
Se necesita investigación de optimización sobre el tamaño de la ventana deslizante y la configuración de los parámetros del mecanismo de atención impulsado por la percepción.
El experimento está limitado al punto de referencia SPEC CPU2017 y requiere validación en otros puntos de referencia o hardware real.
👍