본 논문은 비동기 Q-학습의 수렴성 분석을 개선하는 새로운 접근법을 제시합니다. 기존의 스위칭 시스템 프레임워크를 기반으로 한 분석은 엄격한 조건(예: 준단조성)을 필요로 하여 일반화에 어려움이 있었습니다. 본 논문에서는 $p$-norm을 이용한 동기 Q-학습의 수렴성 분석을 바탕으로, 비동기 Q-학습 및 그 변형(smooth Q-learning) 모두를 다룰 수 있는 더 일반적이고 통합적인 분석 방법을 제안합니다. 이 방법은 더 간단한 프레임워크를 사용하여 일반적인 ODE 모델을 다룰 수 있습니다.