본 논문은 소비자급 하드웨어에서 객체 검출기의 벤치마크 성능과 실제 실행 가능성 간의 격차를 해소하는 데 초점을 맞추고 있습니다. YOLOv10s와 같은 모델은 실시간 속도를 제공하지만, 이러한 성능 지표는 일반적으로 고성능 데스크톱급 GPU에서 달성됩니다. RTX 4060 GPU와 같은 자원 제약 시스템에서는 계산 속도가 아닌 시스템 수준 병목 현상이 성능 저하의 주요 원인임을 밝히고, 이를 해결하기 위해 모델 구조 변경 없이 적용 가능한 Two-Pass Adaptive Inference 알고리즘을 제시합니다. 이 알고리즘은 빠른 저해상도 패스와 필요시 고해상도 패스를 활용하여 속도를 향상시키며, 5000개 이미지 COCO 데이터셋에서 PyTorch Early-Exit 기준 대비 1.85배의 속도 향상과 5.51%의 mAP 손실을 달성했습니다. 순수 모델 최적화보다는 하드웨어 인식 추론 전략을 통해 처리량을 극대화하는 실용적이고 재현 가능한 방법을 제시합니다.