Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SLM-Based Agentic AI with P-C-G: Optimized for Korean Tool Use

Created by
  • Haebom

저자

Changhyun Jeon, Jinhee Park, Jungwoo Choi, Keonwoo Kim, Jisu Kim, Minji Hong

개요

본 논문은 한국어 도구 사용에 최적화된 소규모 언어 모델(SLM) 기반 에이전트 아키텍처인 Planner-Caller-Generator (P-C-G)를 제안합니다. P-C-G는 계획, 호출, 생성을 역할별로 분리하여 Planner는 제한적인 온디맨드 재계획을 통해 초기 일괄 계획을 생성하고, Caller는 공동 스키마-값 검증 후 정규화된 호출 객체를 반환하며, Generator는 도구 출력을 통합하여 최종 답변을 생성합니다. 한국어 환경에서 한국어-영어 코드 전환으로 인한 실행 실패를 줄이기 위해 한국어 우선 값 정책을 적용합니다. 평가는 한국어 질의와 한국어 도구/매개변수 사양을 가정하며, 단일 체인, 다중 체인, 매개변수 누락, 함수 누락 시나리오를 포함하고, 통합 I/O 인터페이스에서 5회 실행에 대한 평균을 낸 LLM-as-a-Judge 프로토콜을 통해 수행됩니다. 결과는 P-C-G가 토큰을 줄이고 허용 가능한 대기 시간을 유지하면서 경쟁력 있는 도구 사용 정확도와 종단 간 품질을 제공함을 보여주며, 역할 전문화 SLM이 한국어 도구 사용 에이전트에 대한 비용 효율적인 대안임을 시사합니다.

시사점, 한계점

시사점:
한국어 도구 사용에 최적화된 소규모 언어 모델 기반 에이전트 아키텍처 P-C-G 제안.
역할 분리(Planner, Caller, Generator)를 통한 효율적인 도구 사용.
한국어 우선 정책을 통한 한국어 환경에서의 실행 실패 감소.
경쟁력 있는 도구 사용 정확도와 종단 간 품질 달성.
토큰 감소 및 허용 가능한 대기 시간 유지.
소규모 모델을 이용한 비용 효율적인 도구 사용 에이전트 구현 가능성 제시.
한계점:
평가가 LLM-as-a-Judge 프로토콜과 제한된 시나리오에 기반하여 수행됨.
실제 다양한 한국어 도구 및 사용 환경에 대한 일반화 가능성에 대한 추가 연구 필요.
P-C-G 아키텍처의 확장성 및 복잡한 작업 처리 능력에 대한 추가적인 검증 필요.
👍