[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Leyendo entre líneas: Combinando la dinámica de pausas y la coherencia semántica para la evaluación automatizada del trastorno del pensamiento

Created by
  • Haebom

Autor

Feng Chen, Weizhe Xu, Changye Li, Serguei Pakhomov, Alex Cohen, Simran Bhola, Sandy Yin, Sunny X Tang, Michael Mackinley, Lena Palaniyappan, Dror Ben-Zeev, Trevor Cohen

Describir

Este estudio utilizó tecnología de reconocimiento automático del habla (ASR) para la evaluación objetiva y escalable del trastorno del pensamiento formal (FTD), un síntoma central del trastorno del espectro esquizofrénico. Para superar las limitaciones de las escalas de evaluación clínica existentes, se analizaron las características lingüísticas y temporales del habla obtenidas mediante ASR, especialmente los movimientos de pausa, y se utilizaron para predecir la gravedad del FTD. Utilizando tres conjuntos de datos (diarios personales naturales, descripciones estructuradas de imágenes e historias de sueños), se realizó un análisis de regresión de vectores de soporte (SVR) combinando las características relacionadas con las pausas y las medidas de consistencia semántica existentes. Como resultado, se confirmó que las características de las pausas por sí solas podían predecir considerablemente la gravedad del FTD, y el modelo que integró las características de las pausas y las medidas de consistencia semántica mostró un mejor rendimiento de predicción que el modelo que solo consideró la semántica (coeficiente de correlación máximo ρ = 0,649, AUC = 83,71%). Estos resultados sugieren que un marco que combina el análisis temporal y semántico puede mejorar la evaluación del lenguaje desorganizado y contribuir al desarrollo del análisis automático del habla en la psicosis.

Takeaways, Limitations

Takeaways:
Presentamos un método de evaluación de FTD objetivo y escalable basado en reconocimiento automático de voz (ASR).
Demostramos que las características de pausa juegan un papel importante en la predicción de la gravedad de la DFT.
Rendimiento mejorado de predicción de FTD mediante la integración de funciones de detención y medidas de consistencia semántica.
Rendimiento mejorado constantemente en una variedad de situaciones (escritura de diario natural, descripciones de imágenes, historias de sueños).
Limitations:
El tamaño del conjunto de datos utilizado puede ser relativamente pequeño.
Se necesitan más investigaciones para determinar la generalización en diferentes orígenes lingüísticos y culturales.
Existe una dependencia del conjunto de datos del patrón de detención.
Se necesitan procesos de validación y estandarización adicionales para el uso clínico.
👍