Sora In London

Status
2024.12
Summary
런던 C21Media Keynote 행사에서 Sora 영상이 시연되었네요. 아주 사실적인 영상과 잘 유지 되는 캐릭터의 일관성이 놀랍습니다. 과연 OpenAI 라이브 행사 12일차에, Sora는 공개될까요?
Category
  1. Sora
Tag
  1. AI Video
Dates
2024/12/09
Created by
  • mintbear
SP
https://slashpage.com/mintbear/SoraInLondon
민트베어 2024.12.09
런던 C21Media Keynote 행사에서 Sora 영상이 공개되었습니다. 위는 행사장 스크린에 출력된 총 2분 길이의 촬영 영상입니다. 앞쪽 1분은 Sora로 생성된 편집 영상, 뒤의 1분은 영상의 이미지-투-비디오와 일관성에 대한 코멘트입니다.
앞쪽 1분의 영상은 아래와 같이 3개의 스토리(#1 바이킹 / #2 정글 / #3 설원)로 구성되어 있고, 생성된 Sora 비디오를 편집한 것으로 보여집니다.

Sora screenshot

아래의 이미지들은 위의 영상을 스크린 캡쳐한 것입니다.

# Story 01 _ Viking War

# Story 02 _ in Jungle

# Story 03 _ Frozen Frontlines

Image-to-Video

이번 시연에서는 이미지-투-비디오(I2V) 기능이 선보였습니다.
Midjourney 이미지를 사용했다고 하고, '미드저니-투-소라' 비디오 생성 결과물의 일부를 앞의 시연 영상에 편집하여 활용한 것으로 보입니다.
SORA OUTPUT : MULTIPLE TAKES
"The camera follows determined female warrior's eyes amidst a chaotic battlefield. Her face is spattered with mud and blood, her piercing blue eyes exuding intensity and resolve. She wears a chainmail and leather armor, adorned with a red leather symbol, and her blonde hair is twisted and windswept. The warrior holds a sword, ready for combat. In the background, other armored warriors, holding shields and weapons, prepare for battle, their figures blurred by the misty, overcast setting. The atmosphere is tense, with a sense of urgency and anticipation, capturing the gritty reality of medieval warfare and the warrior's unwavering courage and readiness to face the conflict. Shot on 35mm film, muted color, strong depth of field."
“카메라는 혼란스러운 전장 속에서 결의에 찬 여성 전사의 눈을 따라갑니다. 그녀의 얼굴은 진흙과 피로 얼룩져 있으며, 강렬하고 단호한 파란 눈빛이 돋보입니다. 그녀는 쇠사슬 갑옷과 가죽 갑옷을 입고 있으며, 빨간 가죽 상징이 장식되어 있습니다. 그녀의 금발 머리는 비틀리고 바람에 흩날리고 있습니다. 전사는 전투를 준비하며 검을 들고 있습니다. 배경에는 안개가 자욱하고 흐린 날씨 속에서 방패와 무기를 든 다른 갑옷 입은 전사들이 전투를 준비하는 모습이 보이는데, 이들의 모습은 흐릿하게 표현되어 있습니다. 분위기는 긴장감과 절박함으로 가득하며, 중세 전쟁의 거친 현실과 전사의 굳건한 용기, 그리고 전투를 마주할 준비 태세를 생생하게 포착합니다. 35mm 필름으로 촬영되었으며, 차분한 색조와 강한 심도가 특징입니다.”
이 이미지-투-비디오(I2V) 영상에는 얼굴에 원본의 피 자국이 매우 잘 유지되어 있고, 몇몇 동작과 표정 연기, 사실적인 연출에 많은 사람들이 놀라워 하고 있지만.. 오히려 연출과 동작 등에서 살짝 아쉬운 부분도 보입니다.
긴장감과 절박함이 넘치는 비디오 프롬프트를 사용했는데, 중간에 맥락없는 과한 얼굴 표정과 어설픈 액션 포즈 등은 그대로 활용하기 어려운 소스이죠. 영상 푸티지는 1분까지 생성되지만, 프롬프트로 컨트롤이 안되는 겁니다. 시연이라 분명히 잘 나온 결과물을 보여준 것일 텐데 말이죠.
사실 이미지-투-비디오(I2V)의 자연스러운 비디오 생성은 이미 Hailuo, Kling 등에서 잘 구현되고 있습니다.
중요한 건, 길게 1분까지 생성되는데, 텍스트 프롬프트로 컨트롤이 되느냐 입니다. 1분 영상이 생성되어도 유저의 니즈에 맞지 않는 결과물이라면 ? 결국 잘라서, 편집 사용해야 한다는 의미가 됩니다.

그럴거면 처음부터 6초, 10초씩 의도에 따라 연장하여 생성하는 방식이 더 유용하죠.
다른 한 편, 또 UI와 편집 및 보조 도구들이 제공되고 있느냐도 중요합니다. 지난 2월 초기의 소개 영상에서는 비디오-투-비디오(V2V) 편집이 자연어 프롬프팅으로 되는 부분도 있었는데, 관련 기능의 강력한 구현이 있기를 바래봅니다.

AI Video Creation with Unmatched Detail and Realism

영상 후반부, 발표자 Chad Nelson 코멘트
“So I’ll be candid, I majored in Mid-Journey 6.1, and I like the resolution. One of the reasons I chose this is because one of the classic cases where you see AI fall apart is when you have high-density pixel patterns. So if you notice her face and her skin, it’s clearly a lot of mud and blood. But if you look at the detail here in Sora’s focal screen, you can see that not only does Sora actually give that mud, keep the pixel patterns intact without going off the interface errors, but it actually gave it 3D depth. And if you look at her nose, like the tip of her nose, you actually see the blood gliding, hardening there at the tip. That’s just Sora basically saying, well, we know how the world kind of operates. How do we take this image and give it more detail? We have a little blood splatter on her teeth. Obviously, her teeth are a little nice for that era. But the fact is, she never even saw her teeth in the JPEG.”
“솔직히 저는 MidJourney 6.1을 주로 사용했고, 그 해상도를 정말 좋아합니다. 제가 이 도구를 선택한 이유 중 하나는, 고밀도 픽셀 패턴을 처리할 때 AI가 흔히 실패하는 전형적인 사례를 볼 수 있기 때문입니다. 그녀의 얼굴과 피부를 보면 진흙과 피가 많이 묻어있는 걸 알 수 있습니다. 그런데 Sora의 포컬 화면에서 디테일을 보면, Sora는 단순히 진흙을 표현하는 데 그치지 않고, 픽셀 패턴을 손상시키지 않으면서도 인터페이스 오류 없이 이를 3D 깊이로 구현했습니다.

예를 들어, 그녀의 코끝을 보면, 거기에 피가 흘러내리다가 굳어가는 모습까지 표현된 걸 확인할 수 있습니다. 이는 Sora가 ‘세상이 이런 방식으로 작동하는 걸 이해했으니 이 이미지를 더 상세하게 만들어보자’라고 말하는 것과 같습니다. 심지어 그녀의 치아에 피가 튀어있는 디테일까지 잡아냈습니다. 물론, 그 시대의 배경을 생각하면 그녀의 치아는 조금 더 현대적이고 잘 표현된 모습이긴 합니다. 재미있는 점은 JPEG 원본 이미지에서는 그녀의 치아가 전혀 보이지 않았다는 것입니다.”


Sora v2 ?

정식 명칭이 될지 모르나, Sora v2 라는 버전으로 아래와 같이 런칭 될거라는 포스팅이 돌고 있어요.
1분 길이의 영상 출력
텍스트-비디오
텍스트+이미지-비디오
텍스트+비디오-비디오
아직 v1 도 경험하지 못한 상황인데, v2는 그냥 임의로 붙인 이름일 것 같아요.

mintbear Comment

OpenAI, 12 Days Live : last is Sora?

12일간의 OpenAI 라이브가 진행되고 있죠. 이제 3일차인데, 관련해서 Sora 출시가 임박했다는 소문이 들립니다.
12일 라이브의 마지막 날에 Sora가 발표될지도 모른다고 하죠. 샘 알트만도 여러가지 소스도 흘려주고 있구요. Sora는 올해 2월부터 예고했는데, 아무런 추가 공개 없이 2024년을 마무리하기엔 샘 알트만도 부담스러웠을 거에요.

언제 공개될까, 그리고 구독 비용은?

하지만 일반 대중 공개까지 될지는 알 수 없습니다. 공개된다고 해도, 비디오 길이나 퀄리티에 제한을 둔 상태일 수도 있습니다. 구독 비용에 차이가 있을 수도 있구요.
며칠전 공개된 o1 Pro 구독 비용이 $200(28만원)인데, 여기에 Sora 포함일 가능성은 낮아 보여요. 만약 포함다면, 저는 Pro에 투자해도 되겠습니다. 하지만, Sora 브랜딩과 퀄리티 유지를 위해 별도의 서비스로 책정하여야 하지 않을까 싶습니다. 사용하게 될 서버의 규모만 해도, 서비스용 프로덕트는 아니니까요.
공개 영상 자체에 대한 분석은 또 따로 진행해보겠습니다.
fn.

Sora Contents

Sora와 관련하여, 아래 콘텐츠도 참고해보세요.
00. Woman Breathing in Bed
⭐️⭐️⭐️⭐️
A middle-aged slightly fat white American lady is sleeping on a simple bed. An obviously noticeable breathing motion is visible, her chest rising and falling under the sheets. This needs to be noticeable and her nostrils should expand and contract slightly. The sheets should move up and down noticeably to indicate the breathing motion. The camera angle is static and does not move at all throughout the entire shot. The lighting is dim and remains that way. Her hands are not visible in the shot. The focus is on the chest breathing motion.
중년의 약간 뚱뚱한 백인 여성이 간단한 침대에서 자고 있다. 그녀의 가슴이 이불 아래에서 오르내리는 것이 눈에 띄게 보이며, 호흡 움직임이 명확하게 드러난다. 콧구멍이 약간 팽창하고 수축하는 모습도 보여야 한다. 이불도 호흡 움직임을 따라 명확하게 위아래로 움직인다. 카메라 앵글은 고정되어 있으며, 전체 촬영 동안 움직이지 않는다. 조명은 어둑하고 변하지 않는다. 그녀의 손은 화면에 보이지 않으며, 초점은 가슴의 호흡 움직임에 맞춰져 있다.
  1. Human
  2. Static Camera
  1. Long Prompt
01. Stylish Man Walking in Neon Seoul
⭐️⭐️⭐️⭐️
A stylish man walks down a Seoul street filled with warm glowing neon and animated city signage. He wears a black leather jacket, a long red dress, and black boots, and carries a black purse. He wears sunglasses and red lipstick. He walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
한 스타일리시한 남성이 서울의 따뜻하게 빛나는 네온과 애니메이션 간판들로 가득한 거리를 걷고 있다. 그는 검은 가죽 재킷, 긴 빨간 드레스, 검은 부츠를 착용하고 검은 가방을 들고 있다. 선글라스와 빨간 립스틱을 착용한 채 자신감 있고 느긋하게 걷는다. 거리는 젖어 있고 반사되어 화려한 조명의 거울 효과를 만들어낸다. 많은 보행자가 거리를 오간다.
  1. Human
  2. Reality
  3. Move Camera
  1. Long Prompt
02. Stylish Woman Walking in Neon Seoul
⭐️⭐️⭐️⭐️
A stylish woman walks down a Seoul street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
한 스타일리시한 여성이 서울의 따뜻하게 빛나는 네온과 애니메이션 간판들로 가득한 거리를 걷고 있다. 그녀는 검은 가죽 재킷, 긴 빨간 드레스, 검은 부츠를 착용하고 검은 가방을 들고 있다. 선글라스와 빨간 립스틱을 착용한 채 자신감 있고 느긋하게 걷는다. 거리는 젖어 있고 반사되어 화려한 조명의 거울 효과를 만들어낸다. 많은 보행자가 거리를 오간다.
  1. Human
  2. Reality
  1. Long Prompt
03. Stylish Woman in Neon Seoul
⭐️⭐️⭐️⭐️⭐️
A stylish woman walks down a Seoul street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
한 스타일리시한 여성이 서울의 따뜻하게 빛나는 네온과 애니메이션 간판들로 가득한 거리를 걷고 있다. 그녀는 검은 가죽 재킷, 긴 빨간 드레스, 검은 부츠를 착용하고 검은 가방을 들고 있다. 선글라스와 빨간 립스틱을 착용한 채 자신감 있고 느긋하게 걷는다. 거리는 젖어 있고 반사되어 화려한 조명의 거울 효과를 만들어낸다. 많은 보행자가 거리를 오간다.
  1. Human
  2. Move Camera
  3. Landscape
  1. Long Prompt
04. Fox in Egypt
⭐️⭐️⭐️⭐️⭐️
An elegant scene set in Egypt featuring a female anthropomorphic fox character. She has vibrant red-orange fur and vivid green eyes, posing gracefully near ancient Egyptian ruins with the iconic pyramids in the background. She is wearing a flowing, semi-transparent, culturally inspired robe with golden patterns. The setting includes sandy terrain, scattered palm trees, and hints of ancient stone structures adorned with hieroglyphics. The sky is clear, and the sun casts a warm glow over the scene, emphasizing the mystique of the Egyptian desert landscape.
이집트를 배경으로 한 우아한 장면. 생생한 빨간색-주황색 털과 선명한 녹색 눈을 가진 여성 의인화 여우 캐릭터가 고대 이집트 유적지 근처에서 우아하게 포즈를 취하고 있다. 배경에는 상징적인 피라미드가 보인다. 그녀는 금빛 무늬가 새겨진 반투명하고 전통적인 영감을 받은 로브를 입고 있다. 배경에는 모래 지형, 드문드문 서 있는 야자수, 그리고 히에로글리프가 새겨진 고대 석조 건축물의 흔적들이 포함되어 있다. 하늘은 맑고, 태양이 장면에 따뜻한 빛을 드리워 이집트 사막 풍경의 신비함을 강조한다.
  1. Animal
  2. Animation
  1. Long Prompt
05. Freeride Skiing at Sunset (Alps)
⭐️⭐️⭐️⭐️
Close-up shot of a freeride skier carving through deep, untouched powder snow during a vibrant sunset in the Alps. The camera starts low, tracking alongside the skier as they make a powerful turn, sending a spray of fine snow into the air. The spray catches the warm golden-pink light of the setting sun, creating a stunning glow and sparkling reflections. The camera then pans upward and slightly rotates, revealing the majestic alpine peaks bathed in the sunset’s hues. The skier continues gracefully downhill, leaving a glowing trail of light and snow in their wake as the scene fades into the serene mountain landscape.
석양이 지는 알프스에서 깊고 손길이 닿지 않은 파우더 스노우를 가로지르는 프리라이드 스키어의 클로즈업 장면. 카메라는 낮은 위치에서 시작해 스키어를 따라가며 강렬한 턴을 할 때 공중으로 뿌려지는 고운 눈을 촬영한다. 이 눈은 석양의 따뜻한 황금빛-분홍빛을 받아 반짝이는 반사를 만들어낸다. 카메라는 위로 팬하며 약간 회전하여 석양의 색조로 물든 웅장한 알프스 산맥을 보여준다. 스키어는 우아하게 내려가며 빛과 눈의 흔적을 남긴다. 장면은 고요한 산 풍경으로 전환되며 끝난다.
  1. Landscape
  2. Human
  3. Dynamic Action
  1. Long Prompt
06. Love in the Rain - Cinematic Trilogy
⭐️⭐️⭐️⭐️
Cinematic still of an epic love scene from the movie The Trilogy, in which two men hug and kiss each other while standing between their cars. A woman stands on top of one car looking at them. In front of her is another man who looks back to see what’s happening behind him. It all takes place under heavy rain, in the style of Steven Spielberg.
영화 트릴로지의 서사적인 사랑 장면을 담은 시네마틱 스틸. 두 남성이 서로의 차 사이에서 포옹하고 키스한다. 한 여성이 한 차량 위에 서서 그들을 바라보고 있다. 그녀 앞에는 또 다른 남성이 뒤를 돌아보며 무슨 일이 벌어지고 있는지 확인한다. 모든 장면은 스티븐 스필버그 스타일로 무거운 비가 내리는 가운데 이루어진다.
  1. Human
  2. Reality
  3. Cinematic
  4. VFX
  1. Long Prompt
07. Futuristic Neon Beachpunk Suit-Up
⭐️
POV, action shots, jumpcuts, montage, tracking shot, from the side hyperspeed, 30x speed, cinematic atmosphere, person having a futuristic neon beachpunk in punk exosuit form around them, suiting up, glow and light, Phanto-Cinematic still, beachpunk gigadream, Kodak Etkar 100, hypersurrealist retrowave religiouscience fiction, Southern California, emocore, hyperfuturistic, beachpunk. ISO: T2.8, compression: ARRIRAW, lighting conditions: ultraviolet blacklight, backlit.
POV, 액션 샷, 점프컷, 몽타주, 옆에서 트래킹 샷, 고속촬영 30배속, 영화적 분위기. 한 인물이 펑크 엑소슈트를 입고 미래 네온 비치펑크 스타일로 변신하는 장면. 빛과 글로우 효과, 판토 시네마틱 스틸, 비치펑크 기가드림, 코닥 에크타 100, 초현실적 레트로웨이브 종교적 공상과학. 장소는 캘리포니아 남부, 이모코어, 초미래적 비치펑크. ISO: T2.8, 압축: ARRIRAW, 조명 조건: 자외선 블랙라이트, 역광.
  1. VFX
  2. Robot, AI
  1. Long Prompt
08. Vintage SUV on a Mountain Dirt Road
⭐️⭐️⭐️⭐️
The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope. Dust kicks up from its tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene.
카메라가 검은 루프 랙이 있는 흰색 빈티지 SUV를 따라가며 경사가 급한 산악 비포장 도로를 달리는 장면을 촬영한다. SUV는 타이어에서 먼지를 일으키며 소나무로 둘러싸인 경사를 올라간다. 햇빛이 SUV에 비추어 장면에 따뜻한 빛을 드리운다.
  1. Landscape
  2. Dynamic Action
  3. Move Camera
  4. Reality
  1. Long Prompt
09. YOMI Beer Rooftop Moment
⭐️⭐️
Style: Modern cinematic realism with vivid visual accents. A summer evening. A group of young friends is gathered on a rooftop, overlooking the glowing city lights. They’re laughing, chatting, and enjoying the vibe with soft music playing in the background. The camera slowly zooms in on a bottle of YOMI beer on the table. Cold condensation drips down the glass, highlighting the vibrant golden hue of the drink.
The focus shifts to a hand reaching for the bottle. The camera follows the motion, capturing the crisp sound of the bottle cap popping open. A sip. A deep breath. A smile. In the background, a voice speaks:
‘YOMI — the taste of the moment. Capture your inspiration.’
Final scene: A bottle of YOMI stands against the backdrop of a setting sun, its golden light refracting through the beer. The brand logo and tagline appear on screen: ‘YOMI. The time of your story.’
스타일: 생생한 시각적 포인트를 강조한 현대적 영화적 사실주의. 여름 저녁, 친구들이 루프탑에 모여 반짝이는 도시의 불빛을 내려다보며 웃고 이야기하며 음악을 즐기고 있다. 카메라는 천천히 테이블 위의 YOMI 맥주 병으로 줌 인한다. 병에서 차가운 물방울이 떨어지며 맥주의 황금빛을 강조한다.
초점은 병을 잡는 손으로 옮겨진다. 카메라는 병뚜껑이 열리는 선명한 소리를 따라간다. 한 모금. 깊은 숨. 미소. 배경에서 목소리가 들린다.
‘YOMI — 순간의 맛을 담다. 당신의 영감을 잡으세요.’
마지막 장면: 석양을 배경으로 서 있는 YOMI 병. 맥주를 통해 굴절되는 황금빛. 브랜드 로고와 슬로건이 화면에 나타난다: ‘YOMI. 당신 이야기의 시간.’
  1. Objects
  2. AD
  1. Long Prompt
10. Longest Zipline in Dubai (1PV)
⭐️⭐️⭐️⭐️⭐️
1st person view taking the longest zip-line in the world through Dubai.
세계에서 가장 긴 집라인을 두바이를 통해 1인칭 시점으로 경험하는 장면.
  1. City
  2. Landscape
  3. Dynamic Action
  4. Move Camera
  5. VFX
  1. Long Prompt
11. Border Collie on Wheels
⭐️⭐️⭐️⭐️
A brown and white border collie stands on a skateboard, wearing sunglasses.
갈색과 흰색의 보더콜리가 스케이트보드를 타고 선글라스를 착용한 장면.
  1. Animal
  2. Dynamic Action
  1. Short Prompt
만약, 포스팅이 도움되셨다면, 아래에 좋아요댓글을 달아주세요 :)
질문이나 여러분의 비디오 작품 공유도 좋아요.
또 만나요-
👍
© 2024.07 mintbear. All Rights Reserved.

06. Love in the Rain - Cinematic Trilogy

Created by
  • mintbear
Quality
⭐️⭐️⭐️⭐️
Category
  1. Long Prompt
Prompt
Cinematic still of an epic love scene from the movie The Trilogy, in which two men hug and kiss each other while standing between their cars. A woman stands on top of one car looking at them. In front of her is another man who looks back to see what’s happening behind him. It all takes place under heavy rain, in the style of Steven Spielberg.
한글 프롬프트
영화 트릴로지의 서사적인 사랑 장면을 담은 시네마틱 스틸. 두 남성이 서로의 차 사이에서 포옹하고 키스한다. 한 여성이 한 차량 위에 서서 그들을 바라보고 있다. 그녀 앞에는 또 다른 남성이 뒤를 돌아보며 무슨 일이 벌어지고 있는지 확인한다. 모든 장면은 스티븐 스필버그 스타일로 무거운 비가 내리는 가운데 이루어진다.
Tag
  1. Human
  2. Reality
  3. Cinematic
  4. VFX
👍