본 논문은 환경 모델과 사전 프로그래밍된 로봇 동작 없이도 능숙한 조작 작업을 해결할 수 있다는 점에서 깊이 있는 모방 학습의 유망성에 대해 논의합니다. 그러나 이를 이중 팔 조작 작업에 적용하는 것은 여전히 어려운 과제입니다. 추가 로봇 매니퓰레이터로 인해 상태 차원이 증가하면 신경망의 성능이 저하됩니다. 본 논문에서는 순차적 입력의 요소 간 종속성을 계산하고 중요한 요소에 집중하는 자기 주의 메커니즘을 사용하여 이 문제를 해결합니다. 자기 주의 아키텍처의 변형인 트랜스포머를 깊이 있는 모방 학습에 적용하여 실제 세계에서 이중 팔 조작 작업을 해결합니다. 실제 로봇을 사용한 이중 팔 조작 작업에서 제안된 방법을 테스트했습니다. 실험 결과, 트랜스포머 기반 깊이 있는 모방 학습 아키텍처는 감각 입력 중 중요한 특징에 주의를 기울여 방해 요소를 줄이고 자기 주의 메커니즘이 없는 기준 아키텍처와 비교하여 조작 성능을 향상시킬 수 있음을 보여주었습니다.