현존 가장 강력한 모델인 하이루오(Hailuo)에 새로운 2D 애니메이션 모델이 추가 업데이트 되었습니다. 일러스트, 애니메이션 캐릭터의 매력을 한층 더 살려주네요! 하이루오의 안정적인 일관성을 바탕으로, 너무나도 부드러운 움직임, 다양한 스타일의 유지, 섬세한 감정 표현까지. 너무나도 완벽합니다! 당분간 실사 보다 애니메이션 제작의 매력에 빠지게 될 것 같습니다. - 민트베어
Gen-3에서 키프레이밍 업데이트를 예고했습니다. 무한히 넓은 캔버스 위에서 이미지와 비디오를 생성 및 배치하고 유기적으로 연결하여, 하나의 시퀀스로 완성해가는 웨이 포인트 작업 방식입니다. 이 기능은 마치 ComfyUI, Ideogram의 Canvas, Recraft, Supercraft, Florafauna 와 같은 캔버스 생성 프로세스를 연상 시킵니다. 앞으로 이렇게 직관적인 '콘텐츠 파이프 온 캔버스' 방식은 가장 중요한 작업 프로세스가 될 것 같습니다. 이미지와 비디오 생성과 편집 과정이 훨씬 더 편리해지겠습니다.
NVIDIA가 텍스트와 오디오 프롬프트를 통해 음악, 음성, 독특한 소리를 생성하고 변환할 수 있는 새로운 생성 AI 모델 'Fugatto'를 공개했습니다. 1) 텍스트 설명을 바탕으로 음악을 생성하거나, 2)기존 음악에 악기를 추가/제거하고, 3) 억양과 감정을 변형하는 등 다양한 오디오 작업이 가능합니다.
OpenAI의 비디오 생성 AI ’소라(Sora)’가 정식 출시 전, API가 잠시 유출되는 사건이 발생했습니다. 여러 유저들에 의해 테스트 되고 유출된 영상은 1080p 해상도의 10초 비디오들로, 시뮬레이션 퀄리티는 매우 높으나, 아직 Text-to-Video 컨트롤이 잘 되지는 않는 부분도 보였습니다. 그 이면에 숨은 이야기도 들어보셔요.
FLUX.1 Tools 는 Flux.1 사용자를 위한 Tools (: 편집 도구 모음)으로, 1 Fill, Depth, Canny, Redux 라는 네 가지 기능의 모듈로 공개 되었습니다. 이미 Stable Diffusion 에서 작동하던 기능이지만, 이제 고퀄리티 이미지의 Flux.1 를 더 다양하게 활용할 수 있게 되었네요.
OpenAI의 비디오 생성 AI ’소라(Sora)’가 정식 출시 전, API가 잠시 유출되는 사건이 발생했습니다. 여러 유저들에 의해 테스트 되고 유출된 영상은 1080p 해상도의 10초 비디오들로, 시뮬레이션 퀄리티는 매우 높으나, 아직 Text-to-Video 컨트롤이 잘 되지는 않는 부분도 보였습니다. 그 이면에 숨은 이야기도 들어보셔요.
비자발적으로 :) 잠시 공개되었던 OpenAI의 Sora 비디오들은 1080p의 높은 해상도임에도 불구하고, 비교적 빠르게 생성되고, 매우 사실적이고 풍부한 요소로 영상을 가득 채워주는, 섬세하면서도 압도적인 물리 시뮬레이션이 돋보였습니다.
그 중에 생성 비디오가 테스트 프롬프트에 정확하게 대응되지 않고, '텍스트 프롬프트 컨트롤'이 아직 완벽하게 되지 않는 수준의 결과물도 종종 보이긴 합니다.
그럼에도 불구하고, 공개된 Sora 영상들은 모두 Image-2-Video의 결과물이 아니라, 오직 텍스트 프롬프트에 의해 생성된 하이-퀄리티의 Text-2-Video 라는 점에서, 현존하는 모든 비디오 생성형 AI 도구들 보다 Sora가 가장 우위에 있는 것은 확실해 보입니다. OpenAI가 스케일 법칙에서 조금 더 앞서 있는 것이죠.
빠르게 발전하는 AI 기술 뒤에 숨겨진 어두운 이면들, 그리고 기술과 예술의 현재 관계에 대해 더 많은 생각을 하게 만드는 사건이었습니다.
동시에 비디오와 프롬프트가 공개되어, 2024년 2월 Sora 기술 발표 이후, 대중 공개까지 10개월 지연되는 동안의 긴 갈증이 해소되는 시간이기도 했습니다.
2024.11.27 OpenAI의 비디오 생성 AI ’소라(Sora)’가 정식 출시 전, API가 잠시 유출되는 사건이 발생했습니다. 여러 유저들에 의해 테스트 되고 유출된 87개의 비디오는 모두 1080p 해상도, 30 FPS, 길이는 대부분 10초입니다. 이 비디오들의 시뮬레이션 퀄리티는 매우 높으나, 아직 Text-to-Video 컨트롤이 잘 되지는 않는 부분도 보였습니다. 이면에 숨은 이야기도 들어보셔요.
개요
’소라 PR 퍼펫(Sora PR Puppets)’이라 자칭하는 예술가 그룹이 소라의 API를 AI 개발 플랫폼 허깅페이스에 공개했습니다. 이로 인해 일반 사용자들이 약 3시간 동안 소라 API에 접근할 수 있었습니다.
유출된 버전은 1080p 해상도의 10초 동영상을 생성할 수 있는 ‘터보’ 버전으로 추정됩니다. 생성된 영상에는 오픈AI의 워터마크가 포함되어 있었습니다.
유출 배경
이번 유출은 소라의 초기 테스터로 참여한 예술가들의 불만에서 비롯되었습니다. 그들의 주장은 다음과 같습니다:
1.
무급 노동: 수백 명의 아티스트가 1,500억 달러 규모의 회사를 위해 무급으로 버그 테스트, 피드백, 실험작 제작 등을 수행했다고 주장합니다.
2.
아트워싱(Artwashing): 오픈AI가 예술가들을 이용해 소라를 예술가들에게 유익한 도구로 홍보하고 있다고 비판했습니다.
3.
콘텐츠 통제: 오픈AI가 소라로 만든 결과물을 공유하기 전 승인을 요구했다고 합니다.
4.
불충분한 보상: 예술가들의 기여에 비해 오픈AI가 제공한 보상이 미미하다고 주장합니다.
오픈AI 대응
오픈AI는 소라에 대한 모든 사용자 접근을 일시적으로 중단했습니다. 회사 측은 초기 접근 프로그램 참여가 자발적이었으며, 피드백 제공이나 도구 사용에 대한 의무가 없었다고 밝혔습니다.
영향 및 시사점
이번 사건은 AI 개발과 창작자 커뮤니티 간의 긴장 관계를 드러냈습니다. 또한 AI 기술의 윤리적 개발, 지적 재산권 문제, 그리고 AI 회사들의 베타 테스트 접근 방식에 대한 논의를 촉발시켰습니다.
소라의 개발 지연 문제와 함께, 이번 유출 사건은 AI 영상 생성 기술의 빠른 발전과 그에 따른 사회적, 윤리적 과제를 보여주는 사례가 되었습니다.