[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un marco multietapa con razonamiento guiado por taxonomía para la clasificación de ocupaciones utilizando modelos lingüísticos amplios

Created by
  • Haebom

Autor

Palakorn Achananuparp, Ee-Peng Lim, Yao Lu

Describir

Este artículo se centra en la tarea de clasificación de ocupaciones, que anota automáticamente datos laborales con ocupaciones estandarizadas en taxonomía. Esta tarea se ve obstaculizada por la falta de datos y la dificultad de la anotación manual. Este estudio señala que, si bien los modelos de lenguaje a gran escala (LLM) son prometedores debido a su amplio conocimiento del mundo y sus capacidades de aprendizaje contextual, su efectividad depende del conocimiento de la taxonomía ocupacional. Por lo tanto, evaluamos la capacidad de los LLM para generar entidades taxonómicas precisas y, en particular, destacamos las limitaciones de los modelos a pequeña escala. Para abordar estas cuestiones, proponemos un marco multietapa que consta de etapas de inferencia, recuperación y reordenación que integran ejemplos de inferencia basados en taxonomía y mejoran el rendimiento mediante la alineación con el conocimiento taxonómico. Los resultados de la evaluación en conjuntos de datos a gran escala muestran que el marco propuesto no solo mejora las tareas de clasificación de ocupaciones y habilidades, sino que también proporciona una alternativa rentable a los modelos de vanguardia como GPT-4o, reduciendo significativamente los costos computacionales y manteniendo un rendimiento robusto. De esta forma, este estudio proporciona una solución práctica y escalable para la clasificación ocupacional y tareas relacionadas en varios LLM.

Takeaways, Limitations

Takeaways:
Sugerir un método para mejorar la eficiencia y precisión de las tareas de clasificación ocupacional utilizando LLM.
El marco de múltiples etapas propuesto proporciona una alternativa rentable a modelos costosos como GPT-4o.
Validación del rendimiento del marco mediante experimentos utilizando conjuntos de datos a gran escala.
Proporcionamos soluciones escalables aplicables a una variedad de LLM.
Limitations:
En el caso de LLM pequeños, existe la posibilidad de que se produzca una degradación del rendimiento.
El rendimiento del marco propuesto puede depender de la calidad del esquema de clasificación utilizado.
Se necesitan más investigaciones sobre la generalización a idiomas o campos ocupacionales específicos.
👍