Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

DEL-ToM: Inference-Time Scaling for Theory-of-Mind Reasoning via Dynamic Epistemic Logic

Created by
  • Haebom

저자

Yuheng Wu, Jianwen Xie, Denghui Zhang, Zhaozhuo Xu

개요

제한된 규모의 소형 언어 모델(SLM)은 심층적인 사회적 추론 능력이 부족하여 Theory-of-Mind(ToM) 과제 수행에 어려움을 겪습니다. 본 연구는 ToM 추론을 향상시키기 위해 아키텍처 변경이 아닌 추론 시간 확장을 활용하는 DEL-ToM 프레임워크를 제안합니다. 동적 인식 논리(DEL)에 기반한 일련의 신념 업데이트로 ToM 과제를 분해하여 구조적이고 투명한 추론을 가능하게 합니다. DEL 시뮬레이터를 통해 자동으로 생성된 레이블을 사용하여 각 신념 업데이트 단계의 점수를 매기는 검증자(Process Belief Model, PBM)를 훈련합니다. 추론 중에 언어 모델이 생성한 후보 신념 추적을 PBM으로 평가하고, 점수가 가장 높은 추적을 선택합니다. 이를 통해 SLM은 테스트 시 추가적인 계산을 할당하여 더욱 신중한 추론을 모방할 수 있습니다. 다양한 모델 규모와 벤치마크에 대한 실험 결과, DEL-ToM은 성능을 일관되게 향상시켜 재훈련 없이 검증 가능한 신념 감독이 SLM의 ToM 능력을 크게 향상시킬 수 있음을 보여줍니다.

시사점, 한계점

시사점:
추론 시간 확장을 통해 소형 언어 모델의 ToM 능력 향상 가능성 제시
DEL 기반의 구조적이고 투명한 추론 프레임워크 제시
검증 가능한 신념 감독을 통한 효과적인 ToM 능력 향상 확인
재훈련 없이 성능 향상 가능
한계점:
DEL-ToM의 성능 향상이 특정 벤치마크 및 모델에 국한될 가능성
DEL 시뮬레이터의 정확성 및 일반화 능력에 대한 추가적인 검증 필요
실제 복잡한 사회적 상황에서의 일반화 능력 평가 필요
추론 시간 확장에 따른 계산 비용 증가 문제
👍