본 논문은 대규모 언어 모델(LLM)을 활용한 소프트웨어 오류 국재화(FL)에서 입력 순서와 컨텍스트 크기의 영향을 조사한다. Java와 Python 프로젝트를 대상으로, 입력 순서를 다르게 하여(정답이 먼저 나오는 경우와 마지막에 나오는 경우) LLM의 FL 성능을 평가했다. 결과적으로 입력 순서에 강한 편향이 존재함을 확인했으며, 컨텍스트 크기를 줄임으로써 이러한 편향을 완화할 수 있음을 보였다. 또한, 전통적인 FL 기법을 기반으로 한 입력 순서 정렬 방법을 탐색하여 DepGraph 기반 방법이 우수한 성능을 보임을 확인했다.