본 논문은 대규모 언어 모델(LLM)이 생성한 텍스트가 정보 무결성과 학술 연구에 미치는 문제를 해결하기 위해, 다양한 도메인에서 AI 생성 텍스트를 탐지하는 M-DAIGT(Multi-Domain Detection of AI-Generated Text) 공동 작업을 소개한다. 특히 뉴스 기사와 학술 논문에서 AI 생성 텍스트를 탐지하는 데 초점을 맞춘다. M-DAIGT는 두 개의 이진 분류 하위 작업으로 구성된다: 뉴스 기사 탐지(NAD, Subtask 1)와 학술 논문 탐지(AWD, Subtask 2). 30,000개의 샘플로 구성된 새로운 대규모 벤치마크 데이터셋을 개발 및 공개했으며, 인간이 작성한 텍스트와 AI 생성 텍스트가 균형 있게 포함되어 있다. AI 생성 콘텐츠는 GPT-4, Claude와 같은 다양한 LLM과 다양한 프롬프트 전략을 사용하여 생성되었다. 총 46개의 팀이 공동 작업에 등록했고, 4개의 팀이 최종 결과를 제출했다. 모든 팀은 Subtask 1과 Subtask 2에 모두 참여했다. 본 논문은 참여 팀의 방법론을 설명하고 M-DAIGT의 향후 방향을 간략하게 논의한다.