본 논문은 텍스트 기반 성격 인식에서 기존의 하드 라벨 분류 방식을 넘어, 인간의 성격 판단의 점진적이고 프로토타입과 유사한 특성을 반영하는 ProtoMBTI라는 프레임워크를 제시한다. ProtoMBTI는 대규모 언어 모델(LLM) 기반 파이프라인 내에서 프로토타입 이론을 구현한다. 모델은 LLM 기반 다차원 증강을 통해 구축된 균형 잡힌 코퍼스를 사용하고, 경량화된 인코더를 LoRA 방식으로 파인 튜닝하여 차별적인 임베딩을 학습하고 성격 프로토타입 은행을 표준화한다. 추론 과정에서는 쿼리 포스트에 대한 상위 k개의 프로토타입을 검색하고, prompt-based 투표를 통해 프로토타입 증거를 집계하며, 불일치가 발생할 경우 수정하고, 정확한 예측 시 샘플을 유지하여 프로토타입 라이브러리를 지속적으로 풍부하게 한다. ProtoMBTI는 Kaggle 및 Pandora 벤치마크에서 4가지 MBTI 이분법과 전체 16가지 유형의 작업 모두에서 기존 모델보다 성능이 향상되었으며, 강력한 교차 데이터셋 일반화 능력을 보였다.