[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

PCDVQ: Mejora de la cuantificación vectorial para modelos lingüísticos grandes mediante el desacoplamiento de coordenadas polares

Created by
  • Haebom

Autor

Yuxuan Yue, Zukang Xu, Zhihang Yuan, Dawei Yang, Jianlong Wu, Liqiang Nie

Describir

En este artículo, proponemos una técnica mejorada de cuantificación vectorial (VQ) para modelos de lenguaje ligeros a gran escala (LLM). Si bien la VQ convencional cuantifica tanto la dirección como la magnitud de un vector, observamos que la dirección es mucho más sensible a la cuantificación que la magnitud. Por consiguiente, proponemos una técnica de cuantificación vectorial separable por coordenadas polares (PCDVQ) que transforma vectores a coordenadas polares y cuantifica la dirección y la magnitud de forma independiente. PCDVQ también incluye un módulo de construcción de libros de códigos alineados con la distribución (DACC) que optimiza el libro de códigos según la distribución de dirección y magnitud. Los resultados experimentales muestran que PCDVQ mejora la precisión de disparo cero en al menos un 1,5 % con respecto a los métodos convencionales de cuantificación de 2 bits.

Takeaways, Limitations

Takeaways:
Presentamos una técnica efectiva de cuantificación vectorial de 2 bits para LLM ligero.
Revelamos diferencias en la sensibilidad de cuantificación a la dirección y magnitud del vector, y proponemos un nuevo marco de cuantificación que tiene esto en cuenta.
Hemos logrado superar las limitaciones de los VQ existentes y mejorar la precisión de disparo cero.
Limitations:
La eficacia del método propuesto podría limitarse a un LLM específico (LLaMA-2-7B) y a una tarea de disparo cero. Es necesario verificar su generalización a otros LLM o tareas.
Falta una descripción detallada del proceso de optimización del módulo DACC. Se requiere un análisis de la complejidad y el coste computacional del proceso de optimización.
Falta un análisis comparativo del rendimiento a diferentes niveles de bits (más de 2 bits). Los resultados limitados a 2 bits podrían tener una generalización limitada.
👍