본 논문은 군중 분석 및 공공 안전 관리에서 중요한 컴퓨터 비전 과제인 군중 계수의 정확성을 높이기 위해, 배경 억제 및 크기 인식에 특화된 강력한 Transformer 기반 군중 계수 네트워크인 RCCFormer를 제안한다. RCCFormer는 다양한 단계에서 추출된 특징을 정교하게 통합하는 다중 수준 특징 융합 모듈(MFFM)을 통합하여 복잡하고 포괄적인 특징 표현을 포착한다. 또한, 세부 정보 포함 주의 블록(DEAB)을 통해 전역 자기 주의 및 지역 주의를 활용하여 문맥 정보와 지역 세부 정보를 학습 가능한 방식으로 효율적으로 융합하여 전경 영역에 집중하고 배경 노이즈 간섭을 효과적으로 완화한다. 더불어, 새로운 입력 의존적 변형 합성곱(IDConv)을 기본 구성 요소로 하는 적응적 크기 인식 모듈(ASAM)을 개발하여 머리 목표의 형태와 크기 변화에 동적으로 적응하여 대규모 변화에 대한 네트워크의 능력을 크게 향상시킨다. ShanghaiTech Part_A 및 Part_B, NWPU-Crowd, QNRF 데이터셋에서 제안된 방법의 효과를 검증하였으며, 모든 네 개의 데이터셋에서 최첨단 결과를 보여주는 우수한 성능을 달성함을 보여준다.