본 논문은 복잡한 작업에 대해 유창한 텍스트를 생성하는 동시에 인간의 정신적 기대와 대규모 언어 모델(LLM)의 신경 처리 간의 신경 상태 유사성을 최적화하는 메타 프롬프팅 방법을 제시합니다. 판사 역할을 하는 LLM(LLMaaJ)이 문맥 내 학습을 통해 생성된 텍스트의 의도된 및 의도되지 않은 특성을 해석하여 다른 LLM에게 콘텐츠 생성 방법을 가르치는 에이전트 강화 학습 기법을 적용합니다. 인간의 콘텐츠에 대한 정신적 믿음을 측정하기 위해, 사용자들은 2024 US 오픈 테니스 그랜드 슬램에서 발표 전에 장문의 AI 생성 텍스트 기사를 수정합니다. LLMaaJ는 인간의 편집을 예상하고 포함하여 LLM의 텍스트 생성에서 마음 이론(ToM) 정렬 문제를 해결할 수 있습니다. 실험과 실시간 프로덕션 시스템의 결과 해석을 통해 인간 콘텐츠 검토자의 기대는 53.8%의 확률로 AI와 100% 일치했으며 평균 반복 횟수는 4.38회였습니다. 사실성, 참신성, 반복성, 관련성과 같은 콘텐츠 특성의 힐베르트 벡터 공간에 대한 기하학적 해석은 공간 부피(모든 특성 중요도)와 정점 정렬(개별 특성 관련성)을 결합하여 LLMaaJ가 인간 ToM을 최적화할 수 있도록 했습니다. 이는 테니스 경기의 범위를 확장하여 콘텐츠 품질을 향상시켰습니다. 2024 US 오픈에서 배포된 본 연구는 스포츠 및 엔터테인먼트의 다른 실시간 이벤트에서도 사용되었습니다.