본 논문은 생성형 AI와 웨어러블 카메라(스마트 안경, AI 기반 핀 등)의 발전에 착안하여, 기초 모델이 1인칭 카메라 데이터를 통해 착용자의 개인적인 삶에 대해 얼마나 학습할 수 있는지 조사한다. 연구자는 1주일 동안 54시간 동안 카메라 헤드셋을 착용하고, 다양한 길이(1분, 1시간, 1일 요약본)의 요약본을 생성한 후, GPT-4o와 GPT-4o-mini 모델을 이 요약본 계층 구조로 미세 조정했다. 미세 조정된 모델을 질의하여 모델이 연구자에 대해 무엇을 학습했는지 확인했다. 결과는 긍정적이면서도 부정적인 측면을 보였다. 두 모델 모두 연구자의 대략적인 나이와 성별과 같은 기본적인 정보를 학습했고, GPT-4o는 연구자가 피츠버그에 거주하는 CMU 박사 과정 학생이며 오른손잡이이고 고양이를 키운다는 사실을 정확하게 추론했다. 그러나 두 모델 모두 환각 현상을 보였으며, 영상에 등장하는 사람들의 이름을 지어내기도 했다.