Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprendiendo de las etiquetas ruidosas generadas por crowdsourcing: una perspectiva de procesamiento de señales

Created by
  • Haebom

Autor

Shahana Ibrahim, Panagiotis A. Traganitis, Xiao Fu, Georgios B. Giannakis

Describir

Este artículo se centra en las técnicas de crowdsourcing utilizadas para construir conjuntos de datos refinados a gran escala, uno de los principales impulsores del desarrollo de la inteligencia artificial (IA) y el aprendizaje automático (AA). Las etiquetas generadas mediante crowdsourcing pueden contener ruido por diversas razones, lo que afecta negativamente al rendimiento del aprendizaje. En este artículo, presentamos las últimas tendencias de investigación en aprendizaje a partir de etiquetas ruidosas generadas mediante crowdsourcing. Revisamos los principales modelos y tratamientos metodológicos de crowdsourcing, desde los modelos estadísticos clásicos hasta los enfoques recientes basados ​​en el aprendizaje profundo, y hacemos especial hincapié en la conexión con la teoría del procesamiento de señales (PS) (como la identificabilidad de factorizaciones tensoriales y matriciales no negativas), sugiriendo nuevas soluciones a los desafíos que el crowdsourcing ha planteado desde hace tiempo. También abordamos nuevos temas importantes para el desarrollo de sistemas de IA/AA de próxima generación, como el crowdsourcing con aprendizaje de refuerzo y retroalimentación humana (RLHF) y la optimización de preferencias directas (DPO). En particular, abordamos técnicas importantes para el ajuste fino de modelos lingüísticos a gran escala (LLM).

Takeaways, Limitations

Takeaways:
Presentación de varios enfoques (modelos estadísticos, enfoques basados ​​en aprendizaje profundo, etc.) y la posibilidad de utilizar la teoría de procesamiento de señales para resolver el problema del ruido de los datos de colaboración colectiva.
Se presenta una nueva solución que explota la identificabilidad de descomposiciones tensoriales y matriciales no negativas.
Se presenta la importancia del crowdsourcing mediante RLHF y DPO y su aplicabilidad al perfeccionamiento del LLM.
Limitations:
Falta de descripción detallada de algoritmos específicos y resultados experimentales.
Falta de análisis comparativo de diferentes modelos y enfoques de crowdsourcing.
Falta de discusión suficiente sobre aplicaciones prácticas.
👍