본 논문은 지속 가능한 금융에서 ESG 요소를 기업 의사결정에 통합하는 과정에서 지속적인 어려움으로 남아있는 규제 프레임워크와의 조정 문제를 다룬다. AI 기반 솔루션을 활용하여 지속가능성 보고서 및 비재무적 공시가 특정 ESG 활동과 얼마나 일치하는지 자동으로 평가하는 것이 이 문제를 해결하는 데 크게 기여할 수 있다. 하지만, 도메인 특화된 상황에서 일반적인 대규모 언어 모델(LLM)의 한계와 구조화되고 고품질의 데이터셋 부족으로 인해 이 작업은 여전히 복잡하다. 본 논문에서는 현세대 LLM이 환경 활동 관련 텍스트를 식별하는 능력을 조사하고, 원본 및 합성 데이터를 결합하여 미세 조정함으로써 성능을 크게 향상시킬 수 있음을 보여준다. EU ESG 분류 체계에 따라 분류된 1,325개의 라벨이 지정된 텍스트 세그먼트를 포함하는 벤치마크 데이터셋인 ESG-Activities를 소개한다. 실험 결과, ESG-Activities에 대한 미세 조정은 분류 정확도를 크게 향상시키며, Llama 7B 및 Gemma 7B와 같은 오픈 모델이 특정 구성에서 대규모 독점 솔루션보다 성능이 뛰어남을 보여준다. 이러한 결과는 고급 자연어 처리 기술을 통해 ESG 투명성과 규정 준수를 강화하고자 하는 금융 분석가, 정책 입안자 및 AI 연구자에게 중요한 의미를 갖는다.