Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Aligning Compound AI Systems via System-level DPO

Created by
  • Haebom

저자

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi Koyejo

개요

본 논문은 다수의 상호작용하는 구성요소(LLM, 기반 모델, 외부 도구 등)로 구성된 복합 AI 시스템이 다양한 작업에서 단일 모델에 비해 현저한 성능 향상을 보임을 설명합니다. 실제 응용 프로그램에 효과적으로 배포하려면 이러한 시스템을 인간의 선호도와 일치시키는 것이 중요합니다. 그러나 단일 모델과 달리 정책 최적화를 통한 복합 시스템 정렬은 구성 요소 간의 비미분 가능한 상호 작용과 시스템 수준의 선호도를 구성 요소 수준의 선호도로 직접 변환할 수 없다는 두 가지 주요 이유로 어렵습니다. 이러한 과제를 해결하기 위해, 본 논문은 먼저 복합 AI 시스템을 DAG(Directed Acyclic Graphs)로 공식화하여 구성 요소 상호 작용과 관련 데이터 흐름을 명시적으로 모델링합니다. 이 공식화를 기반으로, 본 논문은 Direct Preference Optimization (DPO)를 확장하여 공동 시스템 수준 정렬을 가능하게 하는 SysDPO 프레임워크를 소개합니다. 시스템별 선호도 데이터 세트를 구성하는지 여부에 따라 두 가지 변형인 SysDPO-Direct 및 SysDPO-Sampling을 제안합니다. 실험적으로 언어 모델과 확산 모델의 공동 정렬 및 LLM 협업 시스템의 공동 정렬이라는 두 가지 응용 프로그램에서 이 방법의 효과를 입증합니다.

시사점, 한계점

시사점:
복합 AI 시스템의 시스템 수준 선호도 정렬을 위한 새로운 프레임워크인 SysDPO를 제시합니다.
DAG를 이용하여 복합 AI 시스템의 구성요소 상호작용과 데이터 흐름을 효과적으로 모델링합니다.
시스템별 선호도 데이터셋의 유무에 따라 SysDPO-Direct와 SysDPO-Sampling 두 가지 변형을 제공하여 다양한 상황에 적용 가능성을 높입니다.
언어 모델과 확산 모델, LLM 협업 시스템 등 다양한 응용 프로그램에서 SysDPO의 효과를 실험적으로 검증합니다.
한계점:
제안된 프레임워크의 일반화 성능 및 확장성에 대한 추가적인 연구가 필요합니다.
다양하고 복잡한 상호작용을 갖는 더욱 복잡한 복합 AI 시스템에 대한 적용 가능성을 추가적으로 검증해야 합니다.
시스템별 선호도 데이터셋 구축의 어려움 및 비용 문제에 대한 해결책이 필요할 수 있습니다.
👍