본 논문은 실제 환경의 복잡한 광학 왜곡을 고려하여 카메라 내외부 매개변수를 동시에 추정하는 새로운 프레임워크인 AlignDiff를 제시합니다. 기존 방법들과 달리, AlignDiff는 의미론적 특징 대신 기하학적 특징에 초점을 맞춰 국부적인 왜곡을 더 정확하게 모델링합니다. 이는 기하학적 사전 정보를 조건으로 하는 확산 모델을 사용하여 카메라 왜곡과 장면 기하학을 동시에 추정하는 방식입니다. 특히, 에지 기반 어텐션 메커니즘을 도입하여 이미지 가장자리 주변의 기하학적 특징에 집중함으로써 왜곡 예측 성능을 향상시켰습니다. 또한, 3천 개 이상의 다양한 렌즈 형태의 광선 추적 데이터베이스를 활용하여 실제 환경에서의 일반화 성능을 높였습니다. 실험 결과, 제안된 방법은 추정된 광선 번들의 각도 오차를 약 8.2도 감소시키는 등 기존 방법보다 우수한 성능을 보였습니다.