Sign In

LiteCUA: Computer as MCP Server for Computer-Use Agent on AIOS

Created by
  • Haebom
Category
Empty

저자

Kai Mei, Xi Zhu, Hang Gao, Shuhang Lin, Yongfeng Zhang

개요

본 논문은 컴퓨터 사용 에이전트(CUA)의 역량 향상을 위해 환경 컨텍스트화를 통해 설계된 새로운 플랫폼인 AIOS 1.0을 제시합니다. 기존 접근 방식의 한계점인 언어 모델의 세계 이해 방식과 컴퓨터 인터페이스 구조 사이의 의미론적 단절을 해결합니다. AIOS 1.0은 컴퓨터를 언어 모델이 이해할 수 있는 컨텍스트 환경으로 변환하고, 모델 컨텍스트 프로토콜(MCP) 서버 아키텍처를 구현하여 컴퓨터 상태와 작업을 추상화합니다. 이 접근 방식은 인터페이스 복잡성을 의사 결정 복잡성으로부터 분리하여 에이전트가 컴퓨팅 환경에 대해 효과적으로 추론할 수 있도록 합니다. AIOS 1.0을 기반으로 구축된 경량 CUA인 LiteCUA는 OSWorld 벤치마크에서 14.66%의 성공률을 달성하여 단순한 아키텍처에도 불구하고 여러 전문 에이전트 프레임워크보다 뛰어난 성능을 보입니다.

시사점, 한계점

시사점:
언어 모델을 위한 컴퓨터 환경의 컨텍스트화는 더 강력한 CUA 개발에 유망한 방향을 제시합니다.
AIOS 1.0은 인터페이스 복잡성을 줄여 에이전트가 컴퓨팅 환경에 대해 효과적으로 추론할 수 있도록 합니다.
LiteCUA는 단순한 아키텍처에도 불구하고 OSWorld 벤치마크에서 우수한 성능을 보여 AIOS 1.0의 효과를 입증합니다.
한계점:
논문에서 구체적인 한계점은 명시되지 않음.
👍