Sign In

Modulation of temporal decision-making in a deep reinforcement learning agent under the dual-task paradigm

Created by
  • Haebom
Category
Empty

저자

Amrapali Pednekar, Alvaro Garrido-Perez, Yara Khaluf, Pieter Simoens

개요

본 연구는 인공지능(AI) 관점에서 이중 과제 패러다임 내 시간 처리 간섭 현상을 탐구합니다. Overcooked 환경의 단순화된 버전인 이중 과제 설정(단일 과제(T) 및 이중 과제(T+N))을 사용합니다. 두 과제 모두 내장된 시간 생성 과제를 포함하며, 이중 과제(T+N)는 동시에 수 비교 과제를 포함합니다. 각각의 과제에 대해 두 개의 심층 강화 학습(DRL) 에이전트를 개별적으로 훈련시켰습니다. 이러한 에이전트는 인간의 시간 연구와 일치하는 행동을 보였습니다. 특히, 이중 과제(T+N) 에이전트는 단일 과제(T) 에이전트에 비해 유의미하게 시간을 과대 생산했습니다. 이 결과는 네 개의 목표 지속 시간에서 일관되게 나타났습니다. 에이전트의 LSTM 레이어에서 신경 역학에 대한 예비 분석 결과, 전용 타이머 또는 내재적 타이머에 대한 명확한 증거는 발견되지 않았습니다.

시사점, 한계점

시사점:
DRL 에이전트의 행동이 인간의 시간 인지 연구에서 관찰된 것과 유사한 패턴을 보였습니다.
이중 과제 상황에서 시간 과대 생산 현상이 나타났습니다.
DRL 모델을 통해 시간 인지 메커니즘을 연구할 수 있는 가능성을 보여주었습니다.
한계점:
에이전트의 시간 유지 메커니즘을 명확하게 밝혀내지 못했습니다.
LSTM 레이어 분석만으로는 시간 처리의 근본적인 메커니즘을 파악하기 어려웠습니다.
제한된 환경(Overcooked의 단순화 버전)에서 연구가 수행되었습니다.
보다 광범위한 분석과 추가적인 연구가 필요합니다.
👍