Optimizing Large Language Models for ESG Activity Detection in Financial Texts

작성자

Haebom

카테고리

Empty

저자

Mattia Birti, Francesco Osborne, Andrea Maurino

개요

본 논문은 지속 가능한 금융에서 ESG 요소를 기업 의사결정에 통합하는 과정에서 지속적인 어려움으로 남아있는 규제 프레임워크와의 조정 문제를 다룬다. AI 기반 솔루션을 활용하여 지속가능성 보고서 및 비재무적 공시가 특정 ESG 활동과 얼마나 일치하는지 자동으로 평가하는 것이 이 문제를 해결하는 데 크게 기여할 수 있다. 하지만, 도메인 특화된 상황에서 일반적인 대규모 언어 모델(LLM)의 한계와 구조화되고 고품질의 데이터셋 부족으로 인해 이 작업은 여전히 복잡하다. 본 논문에서는 현세대 LLM이 환경 활동 관련 텍스트를 식별하는 능력을 조사하고, 원본 및 합성 데이터를 결합하여 미세 조정함으로써 성능을 크게 향상시킬 수 있음을 보여준다. EU ESG 분류 체계에 따라 분류된 1,325개의 라벨이 지정된 텍스트 세그먼트를 포함하는 벤치마크 데이터셋인 ESG-Activities를 소개한다. 실험 결과, ESG-Activities에 대한 미세 조정은 분류 정확도를 크게 향상시키며, Llama 7B 및 Gemma 7B와 같은 오픈 모델이 특정 구성에서 대규모 독점 솔루션보다 성능이 뛰어남을 보여준다. 이러한 결과는 고급 자연어 처리 기술을 통해 ESG 투명성과 규정 준수를 강화하고자 하는 금융 분석가, 정책 입안자 및 AI 연구자에게 중요한 의미를 갖는다.

시사점, 한계점

•

시사점:

◦

오픈 소스 LLM (Llama 7B, Gemma 7B 등)이 특정 구성에서 독점 LLM보다 ESG 관련 텍스트 분류 성능이 우수할 수 있음을 보여줌.

◦

ESG-Activities 데이터셋을 통해 LLM의 ESG 관련 텍스트 분석 성능 향상 가능성 제시.

◦

AI 기반 솔루션을 활용한 ESG 투명성 및 규정 준수 강화 가능성 제시.

◦

금융 분석가, 정책 입안자 및 AI 연구자에게 실질적인 시사점 제공.

•

한계점:

◦

ESG-Activities 데이터셋의 규모가 상대적으로 작을 수 있음.

◦

EU ESG 분류 체계에 국한된 연구 결과. 다른 분류 체계 적용 시 일반화 가능성에 대한 추가 연구 필요.

◦

LLM의 성능 향상을 위한 미세 조정 방법의 일반화 가능성에 대한 추가 연구 필요.

◦

실제 ESG 보고서의 복잡성과 다양성을 완전히 반영하지 못할 가능성 존재.

PDF 보기

Made with Slashpage