Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Leveraging Dual Process Theory in Language Agent Framework for Real-time Simultaneous Human-AI Collaboration

Created by
  • Haebom

저자

Shao Zhang, Xihuai Wang, Wenhao Zhang, Chaoran Li, Junru Song, Tingyu Li, Lin Qiu, Xuezhi Cao, Xunliang Cai, Wen Yao, Weinan Zhang, Xinbing Wang, Ying Wen

개요

본 논문은 대규모 언어 모델(LLM) 기반 에이전트가 실시간 상호작용을 요구하는 동시 작업에서 어려움을 겪는다는 점을 지적한다. 지연 문제와 변화하는 인간 전략을 추론하는 어려움으로 인해 명시적인 지시 없이 자율적인 의사결정을 내리는 데 어려움을 겪는다. 이를 해결하기 위해 이중 과정 이론(DPT) 기반의 새로운 언어 에이전트 프레임워크인 DPT-Agent를 제안한다. DPT-Agent는 빠른 의사결정을 위한 System 1(유한 상태 기계와 코드 기반 정책 사용)과 인간 의도를 추론하고 추론 기반 자율적 의사결정을 수행하는 System 2(마음 이론과 비동기적 반성 통합)로 구성된다. 실험을 통해 기존 LLM 기반 프레임워크보다 DPT-Agent가 실시간 동시 인간-AI 협업에서 상당한 성능 향상을 보임을 입증한다. DPT-Agent는 LLM이 느린 사고와 추론을 실행 가능한 행동으로 효과적으로 전환하도록 지원하여 성능을 향상시킨다.

시사점, 한계점

시사점:
실시간 동시 인간-AI 협업을 위한 새로운 프레임워크 DPT-Agent 제시
이중 과정 이론(DPT)을 활용하여 LLM 기반 에이전트의 실시간 상호작용 성능 향상
System 1과 System 2의 효과적인 통합을 통한 자율적 의사결정 능력 향상
마음 이론(ToM)과 비동기적 반성의 중요성을 실험적으로 증명
기존 LLM 기반 프레임워크 대비 성능 향상을 실험적으로 검증
오픈소스 코드 공개를 통한 연구의 재현성 및 확장성 확보
한계점:
DPT-Agent의 성능이 특정 작업 및 환경에 의존적일 수 있음
System 2의 추론 과정이 복잡하고 계산 비용이 높을 수 있음
다양한 유형의 인간 전략에 대한 일반화 능력에 대한 추가 연구 필요
실험 환경의 제한으로 인한 일반화 가능성의 한계
더욱 복잡하고 다양한 실시간 상호작용 시나리오에 대한 추가적인 검증 필요
👍