대규모 언어 모델(LLM)이 영상 소견에서 진단 결론을 생성하는 데 유망한 성능을 보이며, 방사선 보고, 수련생 교육 및 품질 관리를 지원한다. 본 연구는 MDCA(Multi-Dimensional Credibility Assessment) 프레임워크를 도입하고 기관별 프롬프트 최적화에 대한 지침을 제공하여 LLM으로 생성된 간 MRI 보고서의 신뢰성을 높이는 것을 목표로 한다. Kimi-K2-Instruct-0905, Qwen3-235B-A22B-Instruct-2507, DeepSeek-V3, ByteDance-Seed-OSS-36B-Instruct를 포함한 여러 고급 LLM의 성능을 평가하고 비교하기 위해 SiliconFlow 플랫폼을 사용한다.