Image | ||||
1 | 텍스트-투-이미지 | T2I | Text-to-Image | 텍스트 프롬프트를 바탕으로 이미지를 생성합니다. (예: 달리3, 미드저니) |
2 | 이미지-투-텍스트 | I2T | Image-to-Text | 이미지를 분석하여 텍스트 설명을 생성합니다. (예: 미드저니 /describe 기능) |
3 | 이미지-투-이미지 | I2I | Image-to-Image | 기존 이미지를 변형하거나 스타일을 적용하여 새로운 이미지를 생성합니다. (예: 스테이블 디퓨전, 미드저니 스타일 레퍼런스) |
Video | ||||
4 | 텍스트-투-비디오 | T2V | Text-to-Video | 텍스트 프롬프트를 바탕으로 비디오를 생성합니다. (예: Gen-2, Pika, Sora, Veo) |
5 | 이미지-투-비디오 | I2V | Image-to-Video | 이미지를 소스로 활용하여 연속적인 비디오를 생성합니다. (예: Gen-3, Pika, EMO, MS VASA-1) |
6 | 비디오-투-비디오 | V2V | Video-to-Video | 비디오의 스타일을 변환하거나 자동 편집하여 새로운 비디오를 생성합니다. (예: Hey-Gen, A1111, Domo) |
7 | 비디오-투-텍스트 | V2T | Video-to-Text | 비디오의 내용을 분석하여 텍스트 설명을 생성합니다. |
Sound | ||||
8 | 사운드-투-텍스트 | S2T | Sound-to-Text | 사운드나 음성을 분석하여 텍스트 설명을 생성합니다. (예: 클로바 노트, ChatGPT 보이스 모드) |
9 | 텍스트-투-사운드 | T2S | Text-to-Sound | 텍스트 설명을 바탕으로 사운드, 보이스, 음악을 생성합니다. (예: Suno, Udio, ElevenLabs) |