Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

WebVIA: A Web-based Vision-Language Agentic Framework for Interactive and Verifiable UI-to-Code Generation

Created by
  • Haebom
Category
Empty

저자

Mingde Xu, Zhen Yang, Wenyi Hong, Lihang Pan, Xinyue Fan, Yan Wang, Xiaotao Gu, Bin Xu, Jie Tang

개요

WebVIA는 UI 디자인 목업을 기능적인 코드로 변환하는 반복적이고 노동 집약적인 과정을 자동화하기 위해 제안된 최초의 에이전트 기반의 대화형 UI-to-Code 생성 및 검증 프레임워크이다. 이 프레임워크는 다중 상태 UI 스크린샷을 캡처하는 탐색 에이전트, 실행 가능한 대화형 코드를 생성하는 UI2Code 모델, 그리고 상호 작용을 검증하는 검증 모듈로 구성된다. WebVIA는 대화형 HTML/CSS/JavaScript 코드를 생성하는 데 있어 기존 모델보다 향상된 성능을 보이며, 코드와 모델은 공개되어 있다.

시사점, 한계점

시사점:
대화형 UI-to-Code 생성 및 검증을 위한 최초의 에이전트 기반 프레임워크 제안.
일반 목적의 에이전트보다 안정적이고 정확한 UI 탐색 수행.
실행 가능한 대화형 HTML/CSS/JavaScript 코드 생성 성능 향상.
한계점:
논문 자체에서 구체적인 한계점이 언급되지 않음. (추가 연구 필요)
👍