1️⃣ KOLORS 1.5 : Kling 이미지 모델인 KOLORS 1.5의 프롬프트 반응성 및 이미지 사실성, 정교함이 향상되었습니다. 2️⃣ AI Virtual Try-On : (텍스트 프롬프트로 고품질 AI 모델을 생성할 수 있는) AI 모델 기능이 AI Virtual Try-On에서 사용 가능합니다. 학습된 모델에 자연스러운 의상 적용 가능. 3️⃣ KLING AI 1.5 : End Frame만으로 5초 또는 10초 길이의 동영상을 생성 기능이 업데이트 되었습니다. 4️⃣ Lip Sync : 고품질 음성 2개와 7가지 감정 선택 기능이 추가되어 캐릭터의 생동감을 극대화할 수 있습니다.
KOLORS 1.5는 이미지 품질, 구도, 조명이 더욱 개선되었으며, AI Virtual Try-On 기능을 통해 자연스럽고 사실적인 의류 디스플레이 동영상을 제작할 수 있습니다. 일부 새로운 기능은 KLING AI 1.6 업데이트에서 지원 예정.
KLING AI 1.6 업데이트 : 프롬프트 대응성 개선, 더 일관적이고 역동적인 결과 / 표준 및 프로페셔널 모드를 지원하며, KLING 1.5 모델 대비 전체적으로 195% 향상된 성능을 제공. / 프롬프트 대응성 향상: 동작, 순차적인 움직임 / 카메라 움직임 등에 대한 프롬프트 반응 개선 및 시작 프레임에 없던 요소 생성 능력 강화. 카메라 무브 및 모션브러시 미작동 -- Sora와 VEO2 출시와 함께 모든 비디오 생성 도구들이 바짝 긴장하는 듯하네요.
구글은 삼성과 퀄컴 협력을 통해 확장현실(XR) 플랫폼인 안드로이드 XR을 발표했습니다. Gemini AI를 기반으로 헤드셋과 안경을 통해 현실을 확장하고 새로운 방식으로 탐색, 연결, 창작을 가능하게 하는 플랫폼입니다. Apple Vision Pro 와의 또 다른 대결 구도가 기대됩니다. 언제냐일 뿐, 시장의 방향은 정해져 있어요.
메타(Meta)가 새로운 워터마크 기술 "Meta Video Seal"을 공개했습니다. 이 기술은 영상에 보이지 않는 워터마크를 삽입해, 저작권 보호와 출처 추적을 가능하게 합니다. 이 워터마크는 영상이 흐려지거나 잘리더라도 유지되며, 압축 과정을 거쳐도 손상되지 않습니다. 필요할 경우 특수 도구를 사용해 워터마크를 추출하고, 영상의 출처를 쉽게 확인할 수 있습니다.
AI 비디오 생성 도구 Pika 2.0 이 출시 되었습니다. 피카 2.0 버전 및 상업적 이용은 Pro Plan($35)에서만 사용 가능합니다. 다양한 템플릿과 Scene Ingredients 조합으로 다양한 스타일의 비디오를 쉽게 제작할 수 있게 되었네요. 프롬프트가 결과물에 더 정확히 반영되는 듯 합니다.
메타 모티보는 디지털 아바타의 전신 동작을 자연스럽게 제어하는 AI 모델로, 메타버스와 VR 환경에서 인간다운 움직임과 상호작용을 구현합니다. 비지도 강화학습과 혁신적 알고리즘을 통해 추가 훈련 없이 다양한 작업 수행이 가능하며, 환경 변화에도 높은 적응력을 제공합니다. 메타버스, 게임, VR 등에서 몰입감과 현실감을 크게 높일 기술입니다.
메타(Meta)에서 사람 이미지의 가상 피팅과 포즈를 제어할 수 있는 AI 이미지 생성 기술 “Leffa”를 발표했습니다. 이 프레임워크는 사람 이미지 생성에 특화되어 있으며, 주요 기능으로는 1️⃣ 가상으로 옷을 갈아입힐 수 있는 [가상 피팅]과 2️⃣생성된 인물의 자세를 변경할 수 있는 [포즈 제어]가 있습니다. Leffa는 생성된 이미지의 외모와 자세를 세밀하게 조절할 수 있는 정밀한 제어 기능을 제공하며, 오픈 소스로 공개되어 누구나 사용할 수 있습니다. --- 테스트 결과, [가상 피팅]은 대체로 상의만 반영 되고, [포즈 제어]에서는 얼굴이 이그러지는 편입니다. 불완전.
미드저니 패치워크는 협업과 AI 지원을 지원하는 무한 캔버스로, 우리 상상 속의 세계를 보다 쉽게 시각화하고 발전시킬 수 있는 도구입니다. 먼저 다음과 같은 컨셉추얼한 용어들이 도입되었습니다. : 스토리 월드, 샌드박스, 캔버스, 로비, 포털, 스크랩 / 또 다음과 같은 같은 다양한 기능 용어들이 추가되었습니다. : 툴박스, 액션바, 페인트, 텔미모어, 개더, 스타일 레퍼런스, 카피 앤 인벤토리, 세이브, 셰어
레오나르도에서 다른 이미지에서 스타일을 유사하게 생성하는 Flow State 를 업데이트 했습니다. [More Like This] 버트늘 사용할 수 있습니다. 무료 사용자는 일일 사용 제한이 있습니다. FlowState는 임시 탭으로, 저장하거나 업스케일하는 이미지 외에는 사용 후 사라집니다.
이제 Elements 기능을 이미지에서 비디오로 생성할 수 있는 KLING AI 1.6 모델과 함께 사용할 수 있습니다! 1-4장의 이미지를 업로드하고, 이미지의 주제(사람, 동물, 사물 또는 장면)를 요소로 선택한 후, 그들의 행동과 상호작용을 설명합니다. 요소와 프롬프트를 기반으로 동영상이 생성됩니다.
다음은 이 기능의 몇 가지 사용 사례입니다:
1. 피사체의 일관성을 위한 Elements
피사체(사람, 캐릭터, 동물, 물체 등)의 요소로 하나 또는 여러 개의 이미지를 업로드하면 일관된 스타일로 이미지 참조를 기반으로 동영상이 생성됩니다. 이는 다양한 장면에서 캐릭터의 일관된 모습을 연출하는 데 특히 유용할 수 있습니다.
또한 장면이나 옷을 요소로 설정하고 프롬프트에서 동작을 지정하여 피사체가 특정 장면에서 특정 방식으로 보이고 움직이도록 할 수도 있습니다. 이를 통해 작업을 보다 창의적으로 제어할 수 있습니다.
Sample 1 : 사람 + 사물 + 공간
Prompt: On the stage, a girl wearing fashionable clothes and a crystal crown calmly gazes at the camera. 무대 위에서 유행하는 옷과 크리스탈 왕관을 쓴 소녀가 차분하게 카메라를 응시한다.
Sample 2 : 동물 + 의복 + 액세리
Prompt: A standing cat character wearing a jacket and sunglasses strikes a pose towards the camera on the stage. 재킷과 선글라스를 쓴 고양이 캐릭터가 무대 위에서 카메라를 향해 포즈를 취한다.
Sample 3 : 동물 + 의복
Prompt: A white Bichon Frisé wearing a red floral Chinese-stylewinter coat licks its paw. 빨간 꽃무늬 중국식 겨울 코트를 입은 하얀 비숑 프리제가 앞발을 핥고 있다.
Sample 4 : 애니 캐릭터 + 공간 + 소품
Prompt: In a café, a cartoon-style elderly man lifts a cup to drink coffee. 카페에서 만화 스타일의 노인이 커피를 마시기 위해 컵을 들어 올린다.
2. 캐릭터 상호작용 Elements
여러 피사체(사람, 동물, 물체)를 업로드 하고, 그들의 상호작용에 대해 묘사합니다.
Sample 5 : 사람 + 사람
Prompt : Two girls hug each other. 두 소녀가 서로 껴안습니다.
살짝 다른 배경과 화풍인데, 조합이 됩니다. 하지만, 살짝 어색하고 클링 다운 톤 다운과 화질 저하는 있네요 :)
Sample 6 : 사람 + 동물
Prompt : A boy rides a Pegasus, soaring through the air, in a magical style.
Sample 7 : 애니 사람 캐릭터 + 애니 동물 캐릭터
Prompt : A cartoon Character wearing a white hat, and a cartoon-style bear, sitting side by side, wave and nudge at each other. 흰색 모자를 쓴 만화 캐릭터와 만화 스타일의 곰이 나란히 앉아 서로에게 손을 흔들고 장난스럽게 팔꿈치를 건넨다.
Test- waiting
저는 테스트를 위해, 일부러 전혀 다른 화풍으로, 전혀 다른 스타일로 4개의 캐릭터를 활용했습니다.
그 중에 2개의 캐릭터는 어느 정도 구현되고, 다른 하나는 동작까지 재현되고, 다른 하나는 사라졌네요. 하지만 아주 훌륭합니다.
서로 다른 스타일의 두 캐릭터도 곧잘 연출해 줍니다. 원본 이미지가 가진 컬러 톤과 두 캐릭터가 만나는 장면을 매칭하려 노력한 흔적이 보이네요. 다만, 클링 답게 살짝 톤 다운되는 현상이 보입니다. 그래도 이 정도면 훌륭해요. 또 첨부 이미지를 스타트 지점으로 최대한 활용하려는 연출 노력도 기특합니다. 일단 합격! 이제 노하우를 쌓아 보죠!
2
1
J
Jae Young Chang
음, 진짜 좋아지겠네요. 앞으로 더 많이 발전할 듯 합니다. 근데 중국산이라고 들었는데 중국산이 다른 것들보다 이렇게 좋다니....이건 인정해야 할 것 같아요
1
1
mintbear
네, 정말 그런 것 같아요. 거대한 대륙의 데이터로 학습된 Kling 과 Hailuo모델은 Sora 조차 따라가지 못하는 영역이 있는 듯 합니다.