Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Analyzing Character Representation in Media Content using Multimodal Foundation Model: Effectiveness and Trust

Created by
  • Haebom

저자

Evdoxia Taka, Debadyuti Bhattacharya, Joanne Garde-Hansen, Sanjay Sharma, Tanaya Guha

개요

본 논문은 AI 기반의 캐릭터 표현 분석 도구를 제시하고 사용자 연구를 통해 그 유용성과 신뢰도를 평가한 연구입니다. Contrastive Language Image Pretraining (CLIP) 기반의 분석 추출 모델을 사용하여 영상 데이터에서 성별과 연령에 따른 캐릭터 표현을 정량화하고, 이를 일반 사용자에게 효과적으로 보여주는 시각화 구성 요소를 포함합니다. 사용자 연구 결과, 참가자들은 시각화된 분석 결과를 이해하고 도구의 전반적인 유용성을 인정하였으나, 더욱 자세한 인구 통계 범주와 문맥 정보를 포함하는 시각화의 필요성을 제기했습니다. AI 기반 성별 및 연령 모델에 대한 신뢰도는 중간에서 낮은 수준으로 나타났지만, AI 사용 자체에 대한 반대는 없었습니다. 도구 코드, 벤치마킹, 사용자 연구 데이터는 GitHub에서 공개됩니다.

시사점, 한계점

시사점:
AI 기반 캐릭터 표현 분석 도구의 유용성을 실증적으로 검증.
일반 사용자를 위한 AI 기반 분석 결과 시각화 디자인의 중요성 강조.
AI 모델의 신뢰도 향상 및 사용자 요구 충족을 위한 추가 연구 방향 제시.
한계점:
사용자 연구의 참가자 규모 및 다양성 제한.
분석에 포함된 인구 통계 범주가 제한적.
AI 모델에 대한 신뢰도가 중간에서 낮은 수준으로 나타남.
더욱 상세한 시각화 및 문맥 정보 제공 필요성 확인.
👍