Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Who Are You Behind the Screen? Implicit MBTI and Gender Detection Using Artificial Intelligence

Created by
  • Haebom
Category
Empty

저자

Kourosh Shahnazari, Seyed Moein Ayyoubzadeh

개요

본 논문은 Telegram 대화 데이터의 언어적 패턴을 직접적으로 분석하여 성격 유형과 성별 변수를 추론하는 암시적 분류 방법을 연구합니다. 기존의 성격 예측 기법이 자기 보고에 의존하는 것과 달리, 본 연구는 Transformer 기반 언어 모델(RoBERTa)을 개선하여 성격 특성 및 성별 차이를 나타내는 복잡한 언어적 단서를 포착합니다. MBTI 유형으로 주석이 달린 1,602명 사용자의 138,866개 메시지와 성별로 주석이 달린 2,598명 사용자의 195,016개 메시지를 포함하는 데이터셋을 사용하여 모델을 학습시켰습니다. 신뢰 수준을 활용하여 모델 정확도를 86.16%까지 높였으며, 성별 분류에서는 74.4%의 정확도를 달성했습니다. 내향적이고 직관적인 성향을 가진 사람들이 텍스트 기반 상호 작용에 더 적극적으로 참여하는 경향을 보였습니다. 본 연구는 Transformer 기반 모델의 효율성과 현실적인 대화 환경에서 정확도와 데이터 적용 범위 간의 절충점을 강조합니다.

시사점, 한계점

시사점:
Transformer 기반 언어 모델이 대화 텍스트 데이터에서 암시적인 성격 및 성별 예측 작업에 효율적임을 보여줌.
신뢰 수준을 활용하여 모델 정확도를 향상시킬 수 있음.
텍스트 기반 상호 작용에서 성격 유형(MBTI)과 성별에 따른 언어적 패턴 차이를 밝힘.
암시적 성격 및 성별 분류를 위한 새로운 접근 방식 제시.
한계점:
데이터 적용 범위와 정확도 사이의 균형 유지에 대한 실질적인 문제점 제기. (높은 정확도를 위해서는 더 많은 데이터가 필요할 수 있음.)
사용된 데이터셋의 특성 (Telegram 데이터)이 다른 플랫폼이나 상황으로 일반화될 수 있는지에 대한 추가 연구 필요.
MBTI 유형과 같은 성격 유형 분류의 한계점을 고려해야 함.
👍