본 논문은 통계적 신호 처리와 미시경제학의 방법론을 활용하여 상호 작용하는 대규모 언어 모델 에이전트(LLMA)의 이론 및 알고리즘을 논의합니다. 온라인 플랫폼의 베이지안 감정 분석에 착안하여, LLMA가 상호 작용하고 베이지안 추론을 수행할 수 있도록 해석 가능한 모델과 알고리즘을 구성합니다. 상호 작용하는 LLMA는 이전 결정과 외부 입력 모두로부터 학습하기 때문에 편향과 군중 행동을 보일 수 있습니다. 따라서 이러한 행동을 이해하고 완화하기 위해 해석 가능한 모델과 확률적 제어 알고리즘을 개발하는 것이 필수적입니다. 본 논문은 세 가지 주요 결과를 제시합니다. 첫째, 미시경제학의 베이지안 공개 선호도를 사용하여 개별 LLMA가 합리적으로 부주의한 (제한된 합리성) 베이지안 효용 극대화에 필요하고 충분한 조건을 만족하며, 관측치가 주어지면 LLMA는 규제된 효용을 극대화하는 행동을 선택함을 보여줍니다. 둘째, 베이지안 사회 학습을 활용하여 베이지안 추론을 수행하는 동안 서로 및 환경과 순차적으로 상호 작용하는 LLMA에 대한 해석 가능한 모델을 구성합니다. 제안된 모델은 상호 작용하는 LLMA가 보이는 군중 행동을 포착합니다. 셋째, 두 가지 설정(a) 중앙 집중식 제어 LLMA (b) 인센티브가 있는 자율 LLMA)에서 군중 행동을 지연시키고 상태 추정 정확도를 향상시키기 위한 확률적 제어 프레임워크를 제안합니다. LLaMA와 같은 오픈 소스 모델과 ChatGPT와 같은 클로즈드 소스 모델을 사용하여 증오 표현 분류 및 제품 품질 평가에 대한 실제 데이터 세트에서 방법의 효과를 입증합니다. 경험적 분석과 수학적 형식주의를 기반으로 본 논문의 주요 결론은 LLMA가 상호 작용할 때 사회적 학습을 보이는 합리적으로 제한된 베이지안 에이전트로 작용한다는 것입니다.