본 논문은 대규모 언어 모델(LLM) 기반 에이전트가 실시간 상호작용을 필요로 하는 동시 작업에서는 어려움을 겪는다는 점을 지적한다. 지연 문제와 변화하는 인간 전략을 추론하는 어려움으로 인해 명시적인 지시 없이 자율적인 결정을 내리는 데 어려움을 겪는다. 이를 해결하기 위해 이중 과정 이론(DPT)을 기반으로 한 새로운 언어 에이전트 프레임워크인 DPT-Agent를 제안한다. DPT-Agent는 빠른 의사결정을 위한 System 1(유한 상태 기계(FSM)와 코드-정책 사용)과 인간의 의도를 추론하고 추론 기반 자율적 결정을 내리는 System 2(마음 이론(ToM)과 비동기적 반성 통합)를 통합한다. 실험 결과, DPT-Agent는 기존 LLM 기반 프레임워크보다 실시간 동시 인간-AI 협업에서 상당한 성능 향상을 보여주었다. 본 논문에서 제안하는 DPT-Agent는 최초로 실시간 동시 인간-AI 협업을 자율적으로 성공적으로 수행하는 언어 에이전트 프레임워크이다.
시사점, 한계점
•
시사점:
◦
LLM 기반 에이전트의 실시간 동시 작업 수행 능력 향상에 대한 새로운 접근 방식 제시.
◦
이중 과정 이론(DPT)을 활용하여 LLM의 느린 사고와 추론을 실행 가능한 행동으로 전환하는 효과적인 방법 제시.
◦
실시간 동시 인간-AI 협업에서의 성능 향상을 실험적으로 검증.
◦
실제 구현 가능한 코드 공개(GitHub).
•
한계점:
◦
제안된 모델의 일반화 성능에 대한 추가적인 연구 필요.
◦
다양한 유형의 작업 및 인간 사용자에 대한 로버스트성 평가 필요.
◦
System 1과 System 2 간의 효율적인 상호 작용 및 정보 전달 메커니즘에 대한 추가적인 연구 필요.