AI Visual News

민트베어가 전하는 AI 이미지 & AI 비디오 뉴스와 정보. 놓치면 안되는 소식만. 민트베어의 인사이트로. 쉽고, 유용하게.
Sora is Open!
  1. AI Video
  1. Sora
  2. AI Films
기다리고 기다리고 기다리고 기다리던 소라님께서 오셨습니다. 비싼 만큼, 현실적 시뮬레이션과 연출 훌륭하구요. 다양한 기능 기대됩니다. 다만, I2V에서는 레퍼런스 이미지의 연출에서 조금 어긋나는 부분이 보입니다. 계속 테스트 해보겠습니다.
2024/12/10
  • mintbear
Sora-01
Sora In London
  1. AI Video
  1. Sora
런던 C21Media Keynote 행사에서 Sora 영상이 시연되었네요. 아주 사실적인 영상과 잘 유지 되는 캐릭터의 일관성이 놀랍습니다. 과연 OpenAI 라이브 행사 12일차에, Sora는 공개될까요?
2024/12/09
  • mintbear
https://slashpage.com/mintbear/SoraInLondon
Hunyuan Video by Tencent
  1. AI Video
  1. Hunyuan
2024년 12월 3일. 중국 텐센트(Tencent)는 강력한 오픈소스 비디오 생성 AI 모델, 훈위안 비디오(Hunyuan Video)를 공개했습니다.
2024/12/07
  • mintbear
https://slashpage.com/mintbear/Hunyuan-01-ref
Hailuo I2V-01-Live
  1. AI Video
  1. Hailuo
현존 가장 강력한 모델인 하이루오(Hailuo)에 새로운 2D 애니메이션 모델이 추가 업데이트 되었습니다. 일러스트, 애니메이션 캐릭터의 매력을 한층 더 살려주네요! 하이루오의 안정적인 일관성을 바탕으로, 너무나도 부드러운 움직임, 다양한 스타일의 유지, 섬세한 감정 표현까지. 너무나도 완벽합니다! 당분간 실사 보다 애니메이션 제작의 매력에 빠지게 될 것 같습니다. - 민트베어
2024/12/04
  • mintbear
Gen-3 비디오 키프레이밍 (프로토타입)
  1. AI Video
  2. Updates
  1. Gen-3
Gen-3에서 키프레이밍 업데이트를 예고했습니다. 무한히 넓은 캔버스 위에서 이미지와 비디오를 생성 및 배치하고 유기적으로 연결하여, 하나의 시퀀스로 완성해가는 웨이 포인트 작업 방식입니다. 이 기능은 마치 ComfyUI, Ideogram의 Canvas, Recraft, Supercraft, Florafauna 와 같은 캔버스 생성 프로세스를 연상 시킵니다. 앞으로 이렇게 직관적인 '콘텐츠 파이프 온 캔버스' 방식은 가장 중요한 작업 프로세스가 될 것 같습니다. 이미지와 비디오 생성과 편집 과정이 훨씬 더 편리해지겠습니다.
2024/12/03
  • mintbear
Fugatto : 오디오 혁신을 예고하는 NVIDIA 생성 AI
  1. AI Sound
  1. NVIDIA
NVIDIA가 텍스트와 오디오 프롬프트를 통해 음악, 음성, 독특한 소리를 생성하고 변환할 수 있는 새로운 생성 AI 모델 'Fugatto'를 공개했습니다. 1) 텍스트 설명을 바탕으로 음악을 생성하거나, 2)기존 음악에 악기를 추가/제거하고, 3) 억양과 감정을 변형하는 등 다양한 오디오 작업이 가능합니다.
2024/12/01
  • mintbear
대한민국AI국제영화제 대상 수상작, Mateo 온라인 상영회(이벤트 종료 / 다음 상영회를 기다려주세요)
  1. AI Video
  1. AI Films
11월 30일, 토요일 오후 2시.
AI 커뮤니티 GPTers 에서 영화 Mateo 마테오 온라인 상영회를 개최합니다.

첨부 링크에서 신청하셔요.
2024/11/30
  • mintbear
Leaked Sora Videos : 소라 API 유출 사건
  1. AI Video
  1. Sora
OpenAI의 비디오 생성 AI ’소라(Sora)’가 정식 출시 전, API가 잠시 유출되는 사건이 발생했습니다. 여러 유저들에 의해 테스트 되고 유출된 영상은 1080p 해상도의 10초 비디오들로, 시뮬레이션 퀄리티는 매우 높으나, 아직 Text-to-Video 컨트롤이 잘 되지는 않는 부분도 보였습니다. 그 이면에 숨은 이야기도 들어보셔요.
2024/11/27
  • mintbear
Leaked Sora Gallery
  1. AI Video
  1. Sora
유출된 소라 비디오 갤러리, 87개의 비디오와 프롬프트 전체
2024/11/27
  • mintbear
루마 Luma updates - with Image Tools
  1. AI Image
  2. AI Video
  3. Updates
  1. Luma
2024/11/25
  • mintbear
일반 유저를 위한 Flux.1 Tools 소개
  1. AI Image
  1. Flux
FLUX.1 Tools 는 Flux.1 사용자를 위한 Tools (: 편집 도구 모음)으로, 1 Fill, Depth, Canny, Redux 라는 네 가지 기능의 모듈로 공개 되었습니다. 이미 Stable Diffusion 에서 작동하던 기능이지만, 이제 고퀄리티 이미지의 Flux.1 를 더 다양하게 활용할 수 있게 되었네요.
2024/11/22
  • mintbear
© 2024.07 mintbear. All Rights Reserved.

Sora In London

Status
2024.12
Summary
런던 C21Media Keynote 행사에서 Sora 영상이 시연되었네요. 아주 사실적인 영상과 잘 유지 되는 캐릭터의 일관성이 놀랍습니다. 과연 OpenAI 라이브 행사 12일차에, Sora는 공개될까요?
Category
  1. Sora
Tag
  1. AI Video
Dates
2024/12/09
Created by
  • mintbear
SP
https://slashpage.com/mintbear/SoraInLondon
민트베어 2024.12.09
런던 C21Media Keynote 행사에서 Sora 영상이 공개되었습니다. 위는 행사장 스크린에 출력된 총 2분 길이의 촬영 영상입니다. 앞쪽 1분은 Sora로 생성된 편집 영상, 뒤의 1분은 영상의 이미지-투-비디오와 일관성에 대한 코멘트입니다.
앞쪽 1분의 영상은 아래와 같이 3개의 스토리(#1 바이킹 / #2 정글 / #3 설원)로 구성되어 있고, 생성된 Sora 비디오를 편집한 것으로 보여집니다.

Sora screenshot

아래의 이미지들은 위의 영상을 스크린 캡쳐한 것입니다.

# Story 01 _ Viking War

# Story 02 _ in Jungle

# Story 03 _ Frozen Frontlines

Image-to-Video

이번 시연에서는 이미지-투-비디오(I2V) 기능이 선보였습니다.
Midjourney 이미지를 사용했다고 하고, '미드저니-투-소라' 비디오 생성 결과물의 일부를 앞의 시연 영상에 편집하여 활용한 것으로 보입니다.
SORA OUTPUT : MULTIPLE TAKES
"The camera follows determined female warrior's eyes amidst a chaotic battlefield. Her face is spattered with mud and blood, her piercing blue eyes exuding intensity and resolve. She wears a chainmail and leather armor, adorned with a red leather symbol, and her blonde hair is twisted and windswept. The warrior holds a sword, ready for combat. In the background, other armored warriors, holding shields and weapons, prepare for battle, their figures blurred by the misty, overcast setting. The atmosphere is tense, with a sense of urgency and anticipation, capturing the gritty reality of medieval warfare and the warrior's unwavering courage and readiness to face the conflict. Shot on 35mm film, muted color, strong depth of field."
“카메라는 혼란스러운 전장 속에서 결의에 찬 여성 전사의 눈을 따라갑니다. 그녀의 얼굴은 진흙과 피로 얼룩져 있으며, 강렬하고 단호한 파란 눈빛이 돋보입니다. 그녀는 쇠사슬 갑옷과 가죽 갑옷을 입고 있으며, 빨간 가죽 상징이 장식되어 있습니다. 그녀의 금발 머리는 비틀리고 바람에 흩날리고 있습니다. 전사는 전투를 준비하며 검을 들고 있습니다. 배경에는 안개가 자욱하고 흐린 날씨 속에서 방패와 무기를 든 다른 갑옷 입은 전사들이 전투를 준비하는 모습이 보이는데, 이들의 모습은 흐릿하게 표현되어 있습니다. 분위기는 긴장감과 절박함으로 가득하며, 중세 전쟁의 거친 현실과 전사의 굳건한 용기, 그리고 전투를 마주할 준비 태세를 생생하게 포착합니다. 35mm 필름으로 촬영되었으며, 차분한 색조와 강한 심도가 특징입니다.”
이 이미지-투-비디오(I2V) 영상에는 얼굴에 원본의 피 자국이 매우 잘 유지되어 있고, 몇몇 동작과 표정 연기, 사실적인 연출에 많은 사람들이 놀라워 하고 있지만.. 오히려 연출과 동작 등에서 살짝 아쉬운 부분도 보입니다.
긴장감과 절박함이 넘치는 비디오 프롬프트를 사용했는데, 중간에 맥락없는 과한 얼굴 표정과 어설픈 액션 포즈 등은 그대로 활용하기 어려운 소스이죠. 영상 푸티지는 1분까지 생성되지만, 프롬프트로 컨트롤이 안되는 겁니다. 시연이라 분명히 잘 나온 결과물을 보여준 것일 텐데 말이죠.
사실 이미지-투-비디오(I2V)의 자연스러운 비디오 생성은 이미 Hailuo, Kling 등에서 잘 구현되고 있습니다.
중요한 건, 길게 1분까지 생성되는데, 텍스트 프롬프트로 컨트롤이 되느냐 입니다. 1분 영상이 생성되어도 유저의 니즈에 맞지 않는 결과물이라면 ? 결국 잘라서, 편집 사용해야 한다는 의미가 됩니다.

그럴거면 처음부터 6초, 10초씩 의도에 따라 연장하여 생성하는 방식이 더 유용하죠.
다른 한 편, 또 UI와 편집 및 보조 도구들이 제공되고 있느냐도 중요합니다. 지난 2월 초기의 소개 영상에서는 비디오-투-비디오(V2V) 편집이 자연어 프롬프팅으로 되는 부분도 있었는데, 관련 기능의 강력한 구현이 있기를 바래봅니다.

AI Video Creation with Unmatched Detail and Realism

영상 후반부, 발표자 Chad Nelson 코멘트
“So I’ll be candid, I majored in Mid-Journey 6.1, and I like the resolution. One of the reasons I chose this is because one of the classic cases where you see AI fall apart is when you have high-density pixel patterns. So if you notice her face and her skin, it’s clearly a lot of mud and blood. But if you look at the detail here in Sora’s focal screen, you can see that not only does Sora actually give that mud, keep the pixel patterns intact without going off the interface errors, but it actually gave it 3D depth. And if you look at her nose, like the tip of her nose, you actually see the blood gliding, hardening there at the tip. That’s just Sora basically saying, well, we know how the world kind of operates. How do we take this image and give it more detail? We have a little blood splatter on her teeth. Obviously, her teeth are a little nice for that era. But the fact is, she never even saw her teeth in the JPEG.”
“솔직히 저는 MidJourney 6.1을 주로 사용했고, 그 해상도를 정말 좋아합니다. 제가 이 도구를 선택한 이유 중 하나는, 고밀도 픽셀 패턴을 처리할 때 AI가 흔히 실패하는 전형적인 사례를 볼 수 있기 때문입니다. 그녀의 얼굴과 피부를 보면 진흙과 피가 많이 묻어있는 걸 알 수 있습니다. 그런데 Sora의 포컬 화면에서 디테일을 보면, Sora는 단순히 진흙을 표현하는 데 그치지 않고, 픽셀 패턴을 손상시키지 않으면서도 인터페이스 오류 없이 이를 3D 깊이로 구현했습니다.

예를 들어, 그녀의 코끝을 보면, 거기에 피가 흘러내리다가 굳어가는 모습까지 표현된 걸 확인할 수 있습니다. 이는 Sora가 ‘세상이 이런 방식으로 작동하는 걸 이해했으니 이 이미지를 더 상세하게 만들어보자’라고 말하는 것과 같습니다. 심지어 그녀의 치아에 피가 튀어있는 디테일까지 잡아냈습니다. 물론, 그 시대의 배경을 생각하면 그녀의 치아는 조금 더 현대적이고 잘 표현된 모습이긴 합니다. 재미있는 점은 JPEG 원본 이미지에서는 그녀의 치아가 전혀 보이지 않았다는 것입니다.”


Sora v2 ?

정식 명칭이 될지 모르나, Sora v2 라는 버전으로 아래와 같이 런칭 될거라는 포스팅이 돌고 있어요.
1분 길이의 영상 출력
텍스트-비디오
텍스트+이미지-비디오
텍스트+비디오-비디오
아직 v1 도 경험하지 못한 상황인데, v2는 그냥 임의로 붙인 이름일 것 같아요.

mintbear Comment

OpenAI, 12 Days Live : last is Sora?

12일간의 OpenAI 라이브가 진행되고 있죠. 이제 3일차인데, 관련해서 Sora 출시가 임박했다는 소문이 들립니다.
12일 라이브의 마지막 날에 Sora가 발표될지도 모른다고 하죠. 샘 알트만도 여러가지 소스도 흘려주고 있구요. Sora는 올해 2월부터 예고했는데, 아무런 추가 공개 없이 2024년을 마무리하기엔 샘 알트만도 부담스러웠을 거에요.

언제 공개될까, 그리고 구독 비용은?

하지만 일반 대중 공개까지 될지는 알 수 없습니다. 공개된다고 해도, 비디오 길이나 퀄리티에 제한을 둔 상태일 수도 있습니다. 구독 비용에 차이가 있을 수도 있구요.
며칠전 공개된 o1 Pro 구독 비용이 $200(28만원)인데, 여기에 Sora 포함일 가능성은 낮아 보여요. 만약 포함다면, 저는 Pro에 투자해도 되겠습니다. 하지만, Sora 브랜딩과 퀄리티 유지를 위해 별도의 서비스로 책정하여야 하지 않을까 싶습니다. 사용하게 될 서버의 규모만 해도, 서비스용 프로덕트는 아니니까요.
공개 영상 자체에 대한 분석은 또 따로 진행해보겠습니다.
fn.

Sora Contents

Sora와 관련하여, 아래 콘텐츠도 참고해보세요.
만약, 포스팅이 도움되셨다면, 아래에 좋아요댓글을 달아주세요 :)
질문이나 여러분의 비디오 작품 공유도 좋아요.
또 만나요-
👍