본 논문은 대형 비전-언어 모델(LVLM)의 구조적 취약성을 연구하여 치명적인 붕괴를 유발하는 중요 뉴런을 식별하는 데 초점을 맞춘다. 특히, Consistently Activated Neurons (CAN) 탐지 및 점진적 마스킹을 통한 중요 뉴런 위치 파악 기법을 제안한다. LLaVA-1.5-7b-hf 및 InstructBLIP-Vicuna-7b 모델에 대한 실험 결과, 언어 모델의 피드-포워드 네트워크의 극히 일부 뉴런(최대 4개)만 마스킹해도 치명적인 붕괴가 발생할 수 있음을 확인했다. 중요 뉴런은 주로 언어 모델에 위치하며, 다운-프로젝션 레이어가 특히 취약하다는 것을 발견했다. 또한, 표현력 저하 후 급격한 완전 붕괴로 이어지는 일관된 두 단계 붕괴 패턴을 관찰했다.