본 논문은 소셜 미디어 게시물의 심층적 주제 분석을 위한 새로운 방법론을 제시합니다. 기존의 방법론이 대규모 비정형 텍스트 데이터의 복잡성과 뉘앙스를 포착하는 데 어려움을 겪는다는 점을 지적하며, 사전 훈련된 언어 모델을 이용한 트윗 임베딩, 차원 축소 및 행렬 분해, 그리고 생성형 AI를 통합하는 접근 방식을 제안합니다. 압축된 트윗 표현을 클러스터링하고, 생성형 AI를 이용하여 에이전트 사고 과정(CoT) 프롬프팅을 통해 주제를 추출하고 명료하게 표현하며, 두 번째 LLM을 통해 품질을 보장합니다. 자폐증 커뮤니티의 트윗을 대상으로 한 사례 연구를 통해 이 방법론의 유용성을 보여주며, 다양한 맥락에 적용 가능한 확장 가능하고 적응력 있는 프레임워크를 제공합니다. 결과는 머신러닝과 생성형 AI를 결합하여 온라인 커뮤니티의 주제 식별 정확도와 심층성을 향상시킬 수 있는 잠재력을 강조합니다.