스마트폰에서 긴 시퀀스 디코딩을 효율적으로 지원하기 위해, DynaKV라는 적응형 KVCache 관리 기법을 제안한다. DRAM 용량 제약으로 인해 발생하는 KVCache의 메모리 문제를 해결하기 위해, DynaKV는 클러스터 기반 인덱싱을 활용하여 플래시 메모리로 KVCache를 오프로딩한다. DynaKV는 Migration-Free Cluster Adaptation, Continuity-Centric Flash Management, Memory-Efficient Cache Design을 통해 정확도와 효율성을 동시에 개선하며, 기존 솔루션 대비 정확도는 1.38배, 속도는 1.47배 향상된 성능을 보인다.