본 논문은 현실적인 음향 시뮬레이션을 위한 새로운 방법인 Mesh-infused Neural Acoustic Field (MiNAF)를 제안합니다. 기존의 신경망 기반 음향 반응(RIR) 예측 방법들이 환경 정보(예: 장면 이미지)를 활용하지만 명시적인 기하학적 정보를 효과적으로 활용하지 못하는 점을 개선하기 위해, MiNAF는 주어진 위치에서 거친 방의 메시를 쿼리하고 거리 분포를 추출하여 국소적 맥락을 명시적으로 표현합니다. 이를 통해 신경망이 더 정확한 RIR 예측을 생성하도록 유도합니다. 실험 결과, MiNAF는 기존 및 최첨단 기법들과 비교하여 다양한 평가 지표에서 경쟁력 있는 성능을 보이며, 특히 제한된 훈련 샘플 데이터셋에서도 강건함을 보여줍니다.