Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

InterFeat: Un canal para encontrar características científicas interesantes

Created by
  • Haebom

Autor

Dan Ofer, Michal Linial, Dafna Shahaf

Describir

Este artículo presenta un proceso integrado para el descubrimiento automático de hipótesis sencillas de interés (relaciones entre características y objetivos, con la dirección del efecto y los posibles mecanismos subyacentes) a partir de datos biomédicos estructurados. Este proceso combina aprendizaje automático, grafos de conocimiento, búsqueda bibliográfica y modelos lingüísticos a gran escala para formalizar el interés como una combinación de novedad, utilidad y relevancia. En experimentos con ocho enfermedades importantes del Biobanco del Reino Unido, el proceso propuesto identificó sistemáticamente los factores de riesgo años antes de su aparición en la literatura. Entre el 45 % y el 53 % de los principales candidatos se validaron como interesantes, en comparación con el 0 % al 7 % de la línea base basada en SHAP. En general, el 28 % de los 109 candidatos fueron calificados como interesantes por expertos médicos. Este proceso aborda el reto de hacer que el interés sea escalable y operativo en todos los objetivos, y los datos y el código están disponibles públicamente ( https://github.com/LinialLab/InterFeat ).

Takeaways, Limitations

Takeaways:
Se presenta una nueva metodología para descubrir automáticamente hipótesis interesantes a partir de datos biomédicos.
Descubra nuevos factores de riesgo con mucha mayor precisión que los métodos existentes.
Se presenta un nuevo método para medir y evaluar cuantitativamente el “interés”.
Garantizar la reproducibilidad y escalabilidad mediante la divulgación de datos y código.
Limitations:
La definición de "interesante" puede ser subjetiva y depende en cierta medida del juicio de expertos.
El rendimiento del pipeline puede variar dependiendo de la calidad y cantidad de datos.
Optimizado para tipos específicos de datos y puede tener limitaciones en la aplicación a otros tipos de datos.
👍