Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

MythTriage: Scalable Detection of Opioid Use Disorder Myths on a Video-Sharing Platform

Created by
  • Haebom

저자

Hayoung Jung, Shravika Mittal, Ananya Aatreya, Navreet Kaur, Munmun De Choudhury, Tanushree Mitra

개요

본 논문은 YouTube에서의 아편류 사용 장애(OUD) 관련 잘못된 정보의 유병률에 대한 최초의 대규모 연구를 제시합니다. 임상 전문가들과 협력하여 8가지 널리 퍼진 잘못된 정보들을 검증하고, 전문가가 라벨링한 비디오 데이터 세트를 공개합니다. 효율적인 라벨링을 위해, 가벼운 모델을 사용하여 일반적인 경우를 처리하고 어려운 경우는 고성능이지만 비용이 많이 드는 대규모 언어 모델(LLM)에 위임하는 MythTriage라는 분류 파이프라인을 도입했습니다. MythTriage는 최대 0.86의 매크로 F1 점수를 달성했으며, 전문가 및 전체 LLM 라벨링에 비해 주석 시간과 재정적 비용을 76% 이상 절감하는 것으로 추정됩니다. 2,900개의 검색 결과와 343,000개의 추천을 분석하여 YouTube에서 잘못된 정보가 지속되는 방식을 밝히고 공중 보건 및 플랫폼 조정을 위한 실행 가능한 통찰력을 제공합니다.

시사점, 한계점

시사점:
YouTube에서 OUD 관련 잘못된 정보의 유병률에 대한 최초의 대규모 연구 결과 제시.
전문가 검증을 거친 OUD 관련 8가지 널리 퍼진 잘못된 정보 데이터셋 공개.
효율적인 라벨링을 위한 MythTriage 파이프라인 개발 및 성능 검증 (최대 0.86 매크로 F1 점수, 비용 76% 절감).
YouTube에서 잘못된 정보가 지속되는 메커니즘에 대한 통찰력 제공 및 공중 보건 및 플랫폼 조정을 위한 실행 가능한 제안.
한계점:
연구 대상이 YouTube로 한정되어 다른 플랫폼의 상황을 반영하지 못할 수 있음.
MythTriage의 성능은 사용된 LLM 및 가벼운 모델의 성능에 의존적임.
8가지로 한정된 잘못된 정보만을 다루어 OUD 관련 모든 잘못된 정보를 포괄하지 못할 수 있음.
연구 결과가 특정 시점의 데이터를 기반으로 하므로 시간 경과에 따른 변화를 반영하지 못할 수 있음.
👍