WebVIA: A Web-based Vision-Language Agentic Framework for Interactive and Verifiable UI-to-Code Generation
Created by
Haebom
Category
Empty
저자
Mingde Xu, Zhen Yang, Wenyi Hong, Lihang Pan, Xinyue Fan, Yan Wang, Xiaotao Gu, Bin Xu, Jie Tang
개요
WebVIA는 UI 디자인 목업을 기능적인 코드로 변환하는 반복적이고 노동 집약적인 과정을 자동화하기 위해 제안된 최초의 에이전트 기반의 대화형 UI-to-Code 생성 및 검증 프레임워크이다. 이 프레임워크는 다중 상태 UI 스크린샷을 캡처하는 탐색 에이전트, 실행 가능한 대화형 코드를 생성하는 UI2Code 모델, 그리고 상호 작용을 검증하는 검증 모듈로 구성된다. WebVIA는 대화형 HTML/CSS/JavaScript 코드를 생성하는 데 있어 기존 모델보다 향상된 성능을 보이며, 코드와 모델은 공개되어 있다.