본 논문은 대규모 Transformer 모델의 컨텍스트 내 학습 능력을 이미지 공간으로 확장하여 분석하는 연구를 제안합니다. 기존 연구에서 Transformer 모델이 선형 함수나 작은 2층 신경망과 같은 함수들을 임의 데이터 상에서 학습할 수 있음을 보였듯이 (Garg et al., 2023), 본 연구는 이를 이미지 공간으로 확장하여 합성곱 신경망 등 더 복잡한 함수들의 컨텍스트 내 학습 가능성을 조사하고자 합니다. 프롬프트와 쿼리를 이용한 몇 샷, 1샷, 제로샷 학습을 통해 이미지 데이터에 대한 응답을 생성하는 능력을 평가할 것입니다.