해봄의 아카이브

SDXL-Turbo : 더 빠르고, 더 선명한 오픈소스 로컬 인공지능 이미지 생성기

Haebom

Nov 29, 20233y ago

Stability AI이 또 엄청난 것을 내놓았습니다. Stable Diffusion으로 이미지 생성 분야의 오픈소스 생태계를 가속화하더니 올해 중순에 공개한 SDXL의 속도까지 겸비한 SDXL-Turbo를 공개 했습니다. 기존 SDXL에서 이미지 생성된 시간을 일반적으로 30% 이상 줄였습니다. (컴퓨터 사양에 따라 다름)

stabilityai/sdxl-turbo · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

huggingface.co

SDXL Turbo

youtu.be

Clipdrop - SDXL Turbo

clipdrop.co

위의 Clipdrop에서 바로 테스트 해보시거나 Hugging Face에서 모델을 받아 로컬 환경에서 돌려보실 수 있습니다. 늘 그렇든 오픈소스로 공개되었으며 무료 입니다. ADD(Adversarial Diffusion Distillation) 기술이 논문 외에 실제 모델과 제품으로서 공개된 첫 사례 입니다.

adversarial_diffusion_distillation.pdf7.70MB

속도와 퀄리티 둘 다 잡은 것도 신기한데, 기존 Diffuison 방식들이 step-by-step으로 노이즈를 처리할 때 100 steps에서 최근에 나온 SDXL도 50 steps이였는데 이것을 1 step으로 줄인 것 또한 무척 인상 깊습니다. '이게 되네?' 도대체 이 친구들은 어떻게 이런 방식으로 접근한 건지 신기합니다. 이미지 생성 쪽에선 확실히 비용 절감 및 새로운 시도가 많이 나올 것 같습니다. 덤으로 이미지를 영상형식으로 바꾸는 기술도 공개했으니 한동한 Tictok이나 Youtube, Meta에 이들이 생성한 게시물들이 퍼지지 않을까 합니다.

Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets — Stability AI

We present Stable Video Diffusion — a latent video diffusion model for high-resolution, state-of-the-art text-to-video and image-to-video generation.

stability.ai

Stable Audio: Fast Timing-Conditioned Latent Audio Diffusion — Stability AI

Stable Audio represents the cutting-edge audio generation research by Stability AI’s generative audio research lab, Harmonai. We continue to improve our model architectures, datasets, and training procedures to improve output quality, controllability, inference speed, and output length.

stability.ai

'haebom' 구독하기

사이트를 구독하면 새 포스트 등 최신 업데이트를 알림과 메일로 가장 먼저 받아보실 수 있습니다.
Slashpage에 가입하고 'haebom'을 구독하세요!