Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

HSFN: Selección jerárquica para la detección de noticias falsas mediante la creación de conjuntos heterogéneos

Created by
  • Haebom

Autor

Sara B. Coutinho, Rafael MO Cruz, Francimaria RS Nascimento, George DC Cavalcanti

Describir

Este artículo se centra en los sistemas de verificación de datos basados ​​en aprendizaje automático, específicamente en los métodos de conjunto que combinan diversos clasificadores, para abordar los sesgos psicológicos (como el sesgo de confirmación) que los hacen vulnerables a la difusión de noticias falsas en redes sociales. El rendimiento de los métodos de conjunto existentes depende en gran medida de la diversidad de los clasificadores que los componen, pero su tendencia a aprender patrones superpuestos dificulta la selección de modelos con verdadera diversidad. Para abordar esto, proponemos HierarchySelect, un novedoso método automático de selección de clasificadores que prioriza la diversidad entre ellos y considera su rendimiento. HierarchySelect calcula la diversidad por pares entre clasificadores y aplica agrupamiento jerárquico para agruparlos en diferentes niveles de granularidad. Selecciona un grupo de clasificadores con diferente diversidad en cada nivel y selecciona el grupo más diverso para formar un conjunto. Al incorporar métricas de evaluación que reflejan el rendimiento de cada clasificador, también garantiza el rendimiento de generalización del conjunto. Validamos el rendimiento de nuestro método comparándolo con métodos existentes mediante experimentos con seis conjuntos de datos diversos y 40 clasificadores heterogéneos.

Takeaways, Limitations

Takeaways:
Presentamos un novedoso método de selección de clasificadores automáticos que contribuye a resolver el problema de las noticias falsas en las redes sociales.
Posibilidad de mejorar el rendimiento del conjunto mediante la selección de clasificadores orientados a la diversidad basados ​​en la agrupación jerárquica.
Validación del método mediante experimentos utilizando diversos conjuntos de datos y clasificadores.
Mejorar la accesibilidad mediante la divulgación de código fuente abierto.
Limitations:
El método propuesto no garantiza el mejor rendimiento en todos los conjuntos de datos (logra el mejor rendimiento en 2 de 6 conjuntos de datos).
Se necesita más investigación para equilibrar óptimamente la diversidad y el rendimiento.
Se necesitan más experimentos con una variedad más amplia de noticias falsas y conjuntos de datos.
👍