본 논문은 방사선과 의사의 업무 부담을 줄이기 위한 방사선학 보고서 생성(RRG) 모델을 개선하는 새로운 방법인 Online Iterative Self-Alignment (OISA)를 제안합니다. 기존의 RRG 모델들은 주로 감독 학습 기반의 미세 조정에 의존하지만, 고품질 주석 데이터의 제한으로 과적합 및 일반화 문제가 발생할 수 있습니다. OISA는 다양한 데이터의 자체 생성, 다중 목표 선호도 데이터에 대한 자체 평가, 다중 목표 최적화를 위한 자체 정렬, 추가 개선을 위한 자체 반복이라는 네 단계로 구성됩니다. 이를 통해 특정 임상 목표에 맞춘 다양한 보고서를 생성하고, 반복적인 다중 목표 최적화를 통해 RRG 모델의 성능을 향상시킵니다. 실험 결과, OISA는 기존 방법보다 우수한 성능을 보임을 확인했습니다.