신뢰할 수 있지만 계산 능력이 제한된 에이전트(검증자)가 강력하지만 신뢰할 수 없는 하나 이상의 에이전트(증명자)와 상호 작용하여 주어진 작업을 해결하는 방법에 대한 문제를 다룹니다. 특히, 에이전트가 신경망으로 표현되는 경우를 연구하며, 이 문제의 해결책을 신경 상호 작용 증명(neural interactive proofs)이라고 합니다. 먼저, 이전에 제안된 상호 작용 프로토콜을 일반화하는 증명자-검증자 게임을 기반으로 하는 통합 프레임워크를 소개합니다. 그런 다음 신경 상호 작용 증명을 생성하기 위한 몇 가지 새로운 프로토콜을 설명하고, 새롭고 기존의 접근 방식을 이론적으로 비교합니다. 마지막으로, 핵심 아이디어를 보여주는 장난감 그래프 동형 문제와 대규모 언어 모델을 사용하는 코드 유효성 검사 작업이라는 두 가지 영역에서 실험을 통해 이 이론을 뒷받침합니다. 이를 통해 향후 신경 상호 작용 증명과 더 안전한 AI 시스템 구축에의 응용에 대한 연구의 기반을 마련하고자 합니다.