ComfyMind: Toward General-Purpose Generation via Tree-Based Planning and Reactive Feedback
Created by
Haebom
저자
Litao Guo (HKUST), Xinli Xu (HKUST), Luozhou Wang (HKUST), Jiantao Lin (HKUST), Jinsong Zhou (HKUST), Zixin Zhang (HKUST), Bolan Su (Bytedance), Ying-Cong Chen (HKUST, HKUST)
개요
ComfyMind는 ComfyUI 플랫폼을 기반으로 구축된 협업 AI 시스템으로, 강력하고 확장 가능한 범용 생성을 가능하게 합니다. 기존 오픈소스 프레임워크의 취약성과 복잡한 실제 애플리케이션 지원의 어려움을 해결하기 위해 자연어로 설명되는 호출 가능한 기능 모듈로 저수준 노드 그래프를 추상화하는 Semantic Workflow Interface (SWI)와 생성을 계층적 의사결정 과정으로 모델링하고 각 단계에서 적응적 수정을 허용하는 Search Tree Planning 메커니즘을 도입했습니다. ComfyBench, GenEval, Reason-Edit 벤치마크 평가 결과, 기존 오픈소스 기준보다 성능이 우수하며 GPT-Image-1과 비슷한 성능을 달성했습니다.