본 논문은 과학적 컴퓨팅을 위한 자율 코드 생성기로서 에이전트형 대규모 언어 모델(LLM)의 신뢰성을 평가하고, 이를 개선하기 위한 Chain of Unit-Physics 프레임워크를 제안한다. 기존 LLM 기반 코드 생성 방식의 한계점(도메인 코드 부족, RLHF의 어려움)을 해결하기 위해, 단위-물리 테스트를 통해 전문가 지식을 코드로 직접 제약하는 역방향 접근 방식을 채택했다. 연소 문제를 벤치마크로 사용하여 프레임워크를 평가한 결과, 기존 방식의 오류를 극복하고 전문가 구현과 유사한 정확도와 성능을 달성했으며, 실용적인 과학 코드 생성 템플릿을 제시한다.