Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Pharos-ESG: A Framework for Multimodal Parsing, Contextual Narration, and Hierarchical Labeling of ESG Report

Created by
  • Haebom
Category
Empty

저자

Yan Chen, Yu Zou, Jialei Zeng, Haoran You, Xiaorui Zhou, Aixi Zhong

개요

본 논문은 ESG 보고서의 복잡성을 해결하기 위해 개발된 Pharos-ESG 프레임워크를 제시한다. Pharos-ESG는 다중 모달 파싱, 문맥적 내러티브 생성, 계층적 레이블링을 통해 ESG 보고서를 구조화된 표현으로 변환한다. 레이아웃 흐름 기반의 읽기 순서 모델링, 목차 앵커를 활용한 계층 인식 분할, 시각적 요소를 자연어로 변환하는 다중 모달 집계 파이프라인을 통합한다. 또한, ESG, GRI, 감성 레이블을 통해 출력을 풍부하게 만들고 금융 연구의 분석적 요구에 맞춰 주석을 생성한다. Pharos-ESG는 문서 파싱 시스템 및 일반적인 다중 모달 모델보다 우수한 성능을 보이며, 대규모 ESG 보고서 데이터세트인 Aurora-ESG를 공개한다.

시사점, 한계점

ESG 보고서의 이해를 위한 혁신적인 프레임워크 제시: Pharos-ESG는 복잡한 ESG 보고서를 구조화하여 접근성을 향상시킨다.
다중 모달 접근 방식: 레이아웃, 계층 구조, 시각적 요소를 통합하여 보다 포괄적인 이해를 제공한다.
Aurora-ESG 데이터세트 공개: 금융 거버넌스 및 의사 결정에서 ESG 통합을 지원하기 위한 대규모 데이터세트 제공.
성능 우수성 입증: 다양한 벤치마크에서 기존 시스템보다 뛰어난 성능을 보임.
한계점: 논문에서 구체적인 한계점에 대한 언급은 없음.
👍