해커 포럼은 새로운 사이버 보안 위협에 대한 중요한 조기 경고 신호를 제공하지만, 비정형적이고 노이즈가 많은 콘텐츠에서 실행 가능한 정보를 추출하는 것은 여전히 상당한 과제입니다. 본 논문에서는 해커 포럼 게시글에서 논의되는 보안 이벤트를 자동으로 탐지, 클러스터링 및 우선 순위를 지정하는 비지도 학습 프레임워크를 제시합니다. 제안하는 방법은 대조 학습으로 미세 조정된 Transformer 기반 임베딩을 활용하여 관련 토론을 별개의 보안 이벤트 클러스터로 그룹화하여 미리 정의된 키워드에 의존하지 않고 제로데이 공개 또는 악성 코드 배포와 같은 사건을 식별합니다. 이 프레임워크는 시의성, 출처 신뢰도, 정보 완전성 및 관련성을 반영하는 정량화 가능한 메트릭을 사용하여 식별된 이벤트의 우선 순위를 지정하는 일일 순위 지정 메커니즘을 통합합니다. 실제 해커 포럼 데이터에 대한 실험적 평가는 본 방법이 노이즈를 효과적으로 줄이고 우선 순위가 높은 위협을 표면화하여 보안 분석가가 사전 대응을 할 수 있게 함을 보여줍니다. 본 연구는 다양한 해커 포럼 토론을 구조화되고 실행 가능한 정보로 변환함으로써 자동화된 위협 탐지 및 분석의 기본적인 과제를 해결합니다.