AI Visual News

민트베어가 전하는 AI 이미지 & AI 비디오 뉴스와 정보. 놓치면 안되는 소식만. 민트베어의 인사이트로. 쉽고, 유용하게.
All
AI Films
Sora
Gen-3
Kling
Hailuo
Hunyuan
Luma
Flux
NVIDIA
mintbear
AI LLM
OpenAI
Krea
워크플로우 스터디 Zoom 미팅 (공개)
  1. Updates
  1. mintbear
GPTers에서 진행한 OpenAI 워크플로우 스터디 마무리하며,

민트베어의 프레임워크와 워크플로우를 공유합니다.

세컨드브레인 관점에서 출발합니다.
2025/02/20
  • mintbear
© 2024.07 mintbear. All Rights Reserved.
Gen-3 Video Prompt Book

Sora In London

Sora screenshot # Story 01 _ Viking War # Story 02 _ in Jungle # Story 03 _ Frozen Frontlines Image-to-Video AI Video Creation with Unmatched Detail and Realism Sora v2 ? mintbear Comment OpenAI, 12 Days Live : last is Sora? 언제 공개될까, 그리고 구독 비용은?Sora Contents
Season
2024.12
Summary
런던 C21Media Keynote 행사에서 Sora 영상이 시연되었네요. 아주 사실적인 영상과 잘 유지 되는 캐릭터의 일관성이 놀랍습니다. 과연 OpenAI 라이브 행사 12일차에, Sora는 공개될까요?
Category
  1. Sora
Tag
  1. AI Video
Dates
2024/12/09
Created by
  • mintbear
SP
https://slashpage.com/mintbear/SoraInLondon
민트베어 2024.12.09
런던 C21Media Keynote 행사에서 Sora 영상이 공개되었습니다. 위는 행사장 스크린에 출력된 총 2분 길이의 촬영 영상입니다. 앞쪽 1분은 Sora로 생성된 편집 영상, 뒤의 1분은 영상의 이미지-투-비디오와 일관성에 대한 코멘트입니다.
앞쪽 1분의 영상은 아래와 같이 3개의 스토리(#1 바이킹 / #2 정글 / #3 설원)로 구성되어 있고, 생성된 Sora 비디오를 편집한 것으로 보여집니다.

Sora screenshot

아래의 이미지들은 위의 영상을 스크린 캡쳐한 것입니다.

# Story 01 _ Viking War

# Story 02 _ in Jungle

# Story 03 _ Frozen Frontlines

Image-to-Video

이번 시연에서는 이미지-투-비디오(I2V) 기능이 선보였습니다.
Midjourney 이미지를 사용했다고 하고, '미드저니-투-소라' 비디오 생성 결과물의 일부를 앞의 시연 영상에 편집하여 활용한 것으로 보입니다.
SORA OUTPUT : MULTIPLE TAKES
"The camera follows determined female warrior's eyes amidst a chaotic battlefield. Her face is spattered with mud and blood, her piercing blue eyes exuding intensity and resolve. She wears a chainmail and leather armor, adorned with a red leather symbol, and her blonde hair is twisted and windswept. The warrior holds a sword, ready for combat. In the background, other armored warriors, holding shields and weapons, prepare for battle, their figures blurred by the misty, overcast setting. The atmosphere is tense, with a sense of urgency and anticipation, capturing the gritty reality of medieval warfare and the warrior's unwavering courage and readiness to face the conflict. Shot on 35mm film, muted color, strong depth of field."
“카메라는 혼란스러운 전장 속에서 결의에 찬 여성 전사의 눈을 따라갑니다. 그녀의 얼굴은 진흙과 피로 얼룩져 있으며, 강렬하고 단호한 파란 눈빛이 돋보입니다. 그녀는 쇠사슬 갑옷과 가죽 갑옷을 입고 있으며, 빨간 가죽 상징이 장식되어 있습니다. 그녀의 금발 머리는 비틀리고 바람에 흩날리고 있습니다. 전사는 전투를 준비하며 검을 들고 있습니다. 배경에는 안개가 자욱하고 흐린 날씨 속에서 방패와 무기를 든 다른 갑옷 입은 전사들이 전투를 준비하는 모습이 보이는데, 이들의 모습은 흐릿하게 표현되어 있습니다. 분위기는 긴장감과 절박함으로 가득하며, 중세 전쟁의 거친 현실과 전사의 굳건한 용기, 그리고 전투를 마주할 준비 태세를 생생하게 포착합니다. 35mm 필름으로 촬영되었으며, 차분한 색조와 강한 심도가 특징입니다.”
이 이미지-투-비디오(I2V) 영상에는 얼굴에 원본의 피 자국이 매우 잘 유지되어 있고, 몇몇 동작과 표정 연기, 사실적인 연출에 많은 사람들이 놀라워 하고 있지만.. 오히려 연출과 동작 등에서 살짝 아쉬운 부분도 보입니다.
긴장감과 절박함이 넘치는 비디오 프롬프트를 사용했는데, 중간에 맥락없는 과한 얼굴 표정과 어설픈 액션 포즈 등은 그대로 활용하기 어려운 소스이죠. 영상 푸티지는 1분까지 생성되지만, 프롬프트로 컨트롤이 안되는 겁니다. 시연이라 분명히 잘 나온 결과물을 보여준 것일 텐데 말이죠.
사실 이미지-투-비디오(I2V)의 자연스러운 비디오 생성은 이미 Hailuo, Kling 등에서 잘 구현되고 있습니다.
Hailuo I2V-01-Live
중요한 건, 길게 1분까지 생성되는데, 텍스트 프롬프트로 컨트롤이 되느냐 입니다. 1분 영상이 생성되어도 유저의 니즈에 맞지 않는 결과물이라면 ? 결국 잘라서, 편집 사용해야 한다는 의미가 됩니다.

그럴거면 처음부터 6초, 10초씩 의도에 따라 연장하여 생성하는 방식이 더 유용하죠.
다른 한 편, 또 UI와 편집 및 보조 도구들이 제공되고 있느냐도 중요합니다. 지난 2월 초기의 소개 영상에서는 비디오-투-비디오(V2V) 편집이 자연어 프롬프팅으로 되는 부분도 있었는데, 관련 기능의 강력한 구현이 있기를 바래봅니다.

AI Video Creation with Unmatched Detail and Realism

영상 후반부, 발표자 Chad Nelson 코멘트
“So I’ll be candid, I majored in Mid-Journey 6.1, and I like the resolution. One of the reasons I chose this is because one of the classic cases where you see AI fall apart is when you have high-density pixel patterns. So if you notice her face and her skin, it’s clearly a lot of mud and blood. But if you look at the detail here in Sora’s focal screen, you can see that not only does Sora actually give that mud, keep the pixel patterns intact without going off the interface errors, but it actually gave it 3D depth. And if you look at her nose, like the tip of her nose, you actually see the blood gliding, hardening there at the tip. That’s just Sora basically saying, well, we know how the world kind of operates. How do we take this image and give it more detail? We have a little blood splatter on her teeth. Obviously, her teeth are a little nice for that era. But the fact is, she never even saw her teeth in the JPEG.”
“솔직히 저는 MidJourney 6.1을 주로 사용했고, 그 해상도를 정말 좋아합니다. 제가 이 도구를 선택한 이유 중 하나는, 고밀도 픽셀 패턴을 처리할 때 AI가 흔히 실패하는 전형적인 사례를 볼 수 있기 때문입니다. 그녀의 얼굴과 피부를 보면 진흙과 피가 많이 묻어있는 걸 알 수 있습니다. 그런데 Sora의 포컬 화면에서 디테일을 보면, Sora는 단순히 진흙을 표현하는 데 그치지 않고, 픽셀 패턴을 손상시키지 않으면서도 인터페이스 오류 없이 이를 3D 깊이로 구현했습니다.

예를 들어, 그녀의 코끝을 보면, 거기에 피가 흘러내리다가 굳어가는 모습까지 표현된 걸 확인할 수 있습니다. 이는 Sora가 ‘세상이 이런 방식으로 작동하는 걸 이해했으니 이 이미지를 더 상세하게 만들어보자’라고 말하는 것과 같습니다. 심지어 그녀의 치아에 피가 튀어있는 디테일까지 잡아냈습니다. 물론, 그 시대의 배경을 생각하면 그녀의 치아는 조금 더 현대적이고 잘 표현된 모습이긴 합니다. 재미있는 점은 JPEG 원본 이미지에서는 그녀의 치아가 전혀 보이지 않았다는 것입니다.”


Sora v2 ?

정식 명칭이 될지 모르나, Sora v2 라는 버전으로 아래와 같이 런칭 될거라는 포스팅이 돌고 있어요.
1분 길이의 영상 출력
텍스트-비디오
텍스트+이미지-비디오
텍스트+비디오-비디오
아직 v1 도 경험하지 못한 상황인데, v2는 그냥 임의로 붙인 이름일 것 같아요.

mintbear Comment

OpenAI, 12 Days Live : last is Sora?

Open AI, 12일간의 라이브
12일간의 OpenAI 라이브가 진행되고 있죠. 이제 3일차인데, 관련해서 Sora 출시가 임박했다는 소문이 들립니다.
12일 라이브의 마지막 날에 Sora가 발표될지도 모른다고 하죠. 샘 알트만도 여러가지 소스도 흘려주고 있구요. Sora는 올해 2월부터 예고했는데, 아무런 추가 공개 없이 2024년을 마무리하기엔 샘 알트만도 부담스러웠을 거에요.

언제 공개될까, 그리고 구독 비용은?

하지만 일반 대중 공개까지 될지는 알 수 없습니다. 공개된다고 해도, 비디오 길이나 퀄리티에 제한을 둔 상태일 수도 있습니다. 구독 비용에 차이가 있을 수도 있구요.
며칠전 공개된 o1 Pro 구독 비용이 $200(28만원)인데, 여기에 Sora 포함일 가능성은 낮아 보여요. 만약 포함다면, 저는 Pro에 투자해도 되겠습니다. 하지만, Sora 브랜딩과 퀄리티 유지를 위해 별도의 서비스로 책정하여야 하지 않을까 싶습니다. 사용하게 될 서버의 규모만 해도, 서비스용 프로덕트는 아니니까요.
공개 영상 자체에 대한 분석은 또 따로 진행해보겠습니다.
fn.

Sora Contents

Sora와 관련하여, 아래 콘텐츠도 참고해보세요.
Sora Films
Open AI, 12일간의 라이브
Sora Video Gallery : Leaked Sora 87 Videos & Prompts
만약, 포스팅이 도움되셨다면, 아래에 좋아요댓글을 달아주세요 :)
질문이나 여러분의 비디오 작품 공유도 좋아요.
또 만나요-
👍
Made with SlashPage