[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Identificación de agrupaciones de tareas para el aprendizaje multitarea mediante información V-Usable puntual

Created by
  • Haebom

Autor

Yingya Li, Timothy Miller, Steven Bethard, Guergana Savova

Describir

Este artículo enfatiza la importancia de la agrupación de tareas en el aprendizaje multitarea y propone una nueva métrica para identificar grupos de tareas óptimos midiendo la relación entre tareas. En particular, presentamos un método para medir la dificultad de las tareas basado en información V-utilizable (PVI) puntual y agrupamos tareas con estimaciones de PVI estadísticamente similares. Mediante experimentos con 15 conjuntos de datos de PLN de dominios generales, biomédicos y clínicos, verificamos la eficacia del método propuesto en comparación con métodos existentes, como Llama 2 y GPT-4. Los resultados experimentales muestran que las tareas agrupadas según PVI alcanzan un rendimiento competitivo con menos parámetros y muestran un rendimiento consistente en todos los dominios.

Takeaways, Limitations

Takeaways:
Demostramos experimentalmente que la agrupación de tareas basada en PVI es eficaz para mejorar el rendimiento del aprendizaje multitarea.
Consiga un rendimiento competitivo con métodos existentes y modelos de lenguaje a gran escala incluso con una pequeña cantidad de parámetros.
Rendimiento consistente en una variedad de dominios (general, biomédico, clínico).
Introducción de nuevas métricas para medir la relevancia del trabajo.
Limitations:
Se necesita más investigación sobre el costo computacional y la eficiencia de los cálculos de PVI.
Es necesaria una mayor validación del desempeño de generalización del indicador propuesto.
Existe la posibilidad de que haya sesgo hacia ciertos dominios o tipos de trabajo.
Se necesitan experimentos adicionales en diferentes tipos de tareas y conjuntos de datos.
👍