Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

How Well Can AI Build SD Models?

Created by
  • Haebom
Category
Empty

저자

William Schoenberg, Davidson Girard, Saras Chung, Ellen O'Neill, Janet Velasquez, Sara Metcalf

개요

본 논문은 시스템 다이내믹스(SD) 모델링에 인공지능(AI)을 활용하는 과정에서 발생할 수 있는 편향성과 불확실성을 해결하기 위해, AI 기반 SD 모델 생성 도구의 평가를 위한 두 가지 지표(기술적 정확성 및 지시사항 준수)를 제시한다. 오픈소스 프로젝트인 sd-ai를 개발하여 AI 기반 도구(예: ChatGPT)를 활용한 동적 모델링을 위한 협업 기반을 마련하고, 이 도구들을 평가하기 위한 포괄적인 테스트 세트를 개발했다. 11개의 대규모 언어 모델(LLM)을 평가한 결과, gpt-4.5-preview가 가장 높은 정확도를 보였으며, o1은 인과 관계 번역에서 완벽한 점수를 기록했다. 하지만 gpt-4o는 비용 효율성이 높았다. AI 기반 SD 모델링 도구 개발의 책임 있는 발전을 위해 지속적인 평가와 이해 관계자 간의 협력을 강조한다.

시사점, 한계점

시사점:
AI 기반 시스템 다이내믹스 모델링 도구의 성능 평가를 위한 객관적인 지표(기술적 정확성, 지시사항 준수) 제시
다양한 LLM의 성능 비교를 통해 AI 기반 모델링 도구 개발의 현황과 과제 제시
오픈소스 프로젝트 sd-ai를 통한 협업 기반 구축 및 지속적인 평가 체계 마련
AI 기반 모델링 도구 개발의 책임 있는 발전 방향 제시
한계점:
현재 평가 지표 및 테스트 세트는 특정한 범위의 문제에만 적용 가능하며, 더욱 포괄적인 평가 체계 개발이 필요할 수 있음
평가에 사용된 LLM의 종류 및 버전에 따라 결과가 달라질 수 있으며, 보다 다양한 LLM에 대한 평가가 필요함
실제 시스템 다이내믹스 모델링 과정에서의 AI 도구 활용에 대한 실증 연구가 부족함
단순한 인과 관계 매핑을 넘어 복잡한 시스템 다이내믹스 모델링에 대한 AI 성능 평가가 필요함.
👍