Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
InterFeat: Un canal para encontrar características científicas interesantes
Created by
Haebom
Autor
Dan Ofer, Michal Linial, Dafna Shahaf
Describir
Este artículo presenta un proceso integrado para el descubrimiento automático de hipótesis sencillas de interés (relaciones entre características y objetivos, con la dirección del efecto y los posibles mecanismos subyacentes) a partir de datos biomédicos estructurados. Este proceso combina aprendizaje automático, grafos de conocimiento, búsqueda bibliográfica y modelos lingüísticos a gran escala para formalizar el interés como una combinación de novedad, utilidad y relevancia. En experimentos con ocho enfermedades importantes del Biobanco del Reino Unido, el proceso propuesto identificó sistemáticamente los factores de riesgo años antes de su aparición en la literatura. Entre el 45 % y el 53 % de los principales candidatos se validaron como interesantes, en comparación con el 0 % al 7 % de la línea base basada en SHAP. En general, el 28 % de los 109 candidatos fueron calificados como interesantes por expertos médicos. Este proceso aborda el reto de hacer que el interés sea escalable y operativo en todos los objetivos, y los datos y el código están disponibles públicamente ( https://github.com/LinialLab/InterFeat ).
Takeaways, Limitations
•
Takeaways:
◦
Se presenta una nueva metodología para descubrir automáticamente hipótesis interesantes a partir de datos biomédicos.
◦
Descubra nuevos factores de riesgo con mucha mayor precisión que los métodos existentes.
◦
Se presenta un nuevo método para medir y evaluar cuantitativamente el “interés”.
◦
Garantizar la reproducibilidad y escalabilidad mediante la divulgación de datos y código.
•
Limitations:
◦
La definición de "interesante" puede ser subjetiva y depende en cierta medida del juicio de expertos.
◦
El rendimiento del pipeline puede variar dependiendo de la calidad y cantidad de datos.
◦
Optimizado para tipos específicos de datos y puede tener limitaciones en la aplicación a otros tipos de datos.