본 논문은 재보험 분야에서 대규모 언어 모델 (LLM)의 신뢰성을 평가하기 위한 건전성 프레임워크를 개발한다. 거버넌스, 데이터 계보, 보증, 복원력 및 규제 준수의 5가지 기둥 구조를 통해 Solvency II, SR 11-7, EIOPA (2025), NAIC (2023) 및 IAIS (2024)의 감독 기대치를 측정 가능한 수명 주기 관리로 변환한다. Reinsurance AI Reliability and Assurance Benchmark (RAIRAB)를 통해 구현되었으며, 거버넌스 내장 LLM이 근거, 투명성 및 책임에 대한 건전성 기준을 충족하는지 평가한다. 6가지 작업군에서 검색 기반 구성은 더 높은 근거 정확도(0.90)를 달성했으며, 환각 및 해석적 드리프트를 약 40% 감소시켰고, 투명성을 거의 두 배로 높였다. 이러한 메커니즘은 위험 이전 및 자본 할당에서 정보 마찰을 줄여, 거버넌스가 명확하고, 데이터 추적이 가능하며, 보증이 검증 가능한 경우 기존 건전성 원칙이 이미 신뢰할 수 있는 AI를 수용할 수 있음을 보여준다.