본 논문은 다양한 분야에서 민감한 개인 정보를 포함하는 텍스트 데이터의 증가에 따라 개인 정보 보호 및 규정 준수를 보장하면서 다양하고 중요한 후속 작업을 위해 데이터 사용성을 유지하기 위한 강력한 익명화 기술의 필요성을 강조합니다. 본 논문은 텍스트 익명화 기술의 현재 동향과 최근 발전에 대한 포괄적인 개요를 제공합니다. 주로 개체명 인식(Named Entity Recognition)에 중점을 둔 기본적인 접근 방식을 논의한 후, 정교한 익명화 도구이자 강력한 익명화 해제 위협으로서의 이중 역할을 자세히 설명하면서 대규모 언어 모델(LLM)의 변혁적인 영향을 조사합니다. 또한 의료, 법률, 금융, 교육과 같은 중요한 분야에서의 도메인별 과제와 맞춤형 솔루션을 탐구하고, 공식적인 개인 정보 보호 모델과 위험 인식 프레임워크를 통합한 고급 방법론을 조사하며 저자 익명화의 전문 하위 분야를 다룹니다. 추가적으로, 익명화 솔루션의 실제 배포를 위한 평가 프레임워크, 포괄적인 지표, 벤치마크 및 실용적인 툴킷을 검토합니다. 이 논문은 현재의 지식을 통합하고, 진화하는 개인 정보 보호-유용성 간의 상충 관계, 준 식별자를 해결할 필요성 및 LLM 기능의 의미를 포함한 새로운 동향과 지속적인 과제를 파악하며, 이 분야의 학계와 실무자 모두를 위한 미래 연구 방향을 제시하는 것을 목표로 합니다.