사이버 공격의 증가와 정교함에 대응하기 위해, 본 연구는 머신러닝 기반의 사이버 위협 인텔리전스(CTI)를 활용하여 악성 게시물을 탐지하는 방법을 제시한다. 특히 브라질 포르투갈어로 작성된 다크 웹 포럼 데이터를 대상으로 텍스트 마이닝과 머신러닝 기법을 적용하여 악성 게시물을 식별한다. 세 개의 원본 데이터 세트를 생성하고, IoCs(침해 지표), 문맥 키워드, 수동 분석을 결합한 다단계 레이블링 프로세스를 개발했으며, 텍스트 표현 및 분류기에 대한 포괄적인 평가를 수행했다. LightGBM과 TF-IDF를 사용한 모델이 높은 정확도로 관련 게시물을 탐지했으며, 토픽 모델링을 통해 모델의 유효성을 검증했다.