AI Visual News

민트베어가 전하는 AI 이미지 & AI 비디오 뉴스와 정보. 놓치면 안되는 소식만. 민트베어의 인사이트로. 쉽고, 유용하게.
All
AI Films
Sora
Gen-3
Kling
Hailuo
Hunyuan
Luma
Pixverse
Flux
NVIDIA
mintbear
AI LLM
OpenAI
Krea
Gen-4
[ 조코딩 x 민트베어 ] AI 이미지 특강
  1. AI Image
  2. AI Video
  3. AI Sound
  1. AI Films
  2. mintbear
  3. Sora
  4. Gen-4
2025년 4월 8일 저녁 8시.
유튜버 조코딩 님의 초대석 라이브에 민트베어가 출연합니다.
2025/04/08
  • mintbear
비디오 제작도구 비교 : Kling & Hailuo & Luma & Pixverse & Sora
  1. Kling
  2. Hailuo
  3. Sora
  4. Luma
  5. Pixverse
2025/03/10
  • mintbear
👍
1
워크플로우 스터디 Zoom 미팅 (공개)
  1. Updates
  1. mintbear
GPTers에서 진행한 OpenAI 워크플로우 스터디 마무리하며,

민트베어의 프레임워크와 워크플로우를 공유합니다.

세컨드브레인 관점에서 출발합니다.
2025/02/20
  • mintbear
Krea Chat : 대화로 만드는 이미지 & 비디오
  1. AI Image
  2. AI Video
  3. Updates
  1. Krea
  2. AI Films
  3. Flux
  4. Hailuo
  5. Kling
  6. Luma
이제 krea.ai 에서는 채팅으로 이미지와 비디오를 생성합니다.

AI와 간단한 채팅으로 Flux 이미지를 생성하고, 연결되어 있는 Hailuo, Kling, Luma 비디오를 만들죠.

2025년은 대화로 이미지와 비디오를 만드는 시대입니다.
2025/02/08
  • mintbear
ChatGPT 'o3' 모델을 이용한 심층 리서치(Deep Research)
  1. Updates
  1. AI LLM
  2. OpenAI
[ GPTers OpenAI 워크플로우 스터디 사례 ]

최근 업데이트 된 '심층 리서치(DeepResearch)' 기능을 o3 모델에서 테스트 해봤습니다.

($200 Pro Plan)
.
2025/02/06
  • mintbear
2025 AI 시대의 인간지능 컨퍼런스 (현장 스케치)
  1. AI Video
  1. AI Films
  2. mintbear
[2025 AI 시대의 인간지능 컨퍼런스] 현장 스케치입니다.

- 연사 : 민트베어, CMDS 구요한, 윤누리, 챗사피엔스, DECK, 한동빈, 여행가J
- 스태프 : 여행가J, 김민철, 김진영, 이재엽, AJ 정진영, 리즈 정혜령, 이모카 이석호, 이태극
- 사회 : 강성준 | 후원 : 마크인포 & 지피터스 커뮤니티

🍀
2025/01/12
  • mintbear
2
2025 AI 시대의 인간지능 컨퍼런스 (민트베어 강연)
  1. AI Video
  1. AI Films
  2. mintbear
[2025 AI 시대의 인간지능 컨퍼런스] 민트베어의 강연 입니다.

1. 완전히 변화된 필름 비즈니스 & 창작자들에게 주어진 거대한 자유
2. 여러 AI 도구들 사이에 연결된 워크 플로우의 중요성
3. 불확실한 시대에 우리의 선택이 열어주는 예측 가능성

🍀
2025/01/12
  • mintbear
Sora is Open!
  1. AI Video
  1. Sora
  2. AI Films
기다리고 기다리고 기다리고 기다리던 소라님께서 오셨습니다. 비싼 만큼, 현실적 시뮬레이션과 연출 훌륭하구요. 다양한 기능 기대됩니다. 다만, I2V에서는 레퍼런스 이미지의 연출에서 조금 어긋나는 부분이 보입니다. 계속 테스트 해보겠습니다.
2024/12/10
  • mintbear
Sora-01
Sora In London
  1. AI Video
  1. Sora
런던 C21Media Keynote 행사에서 Sora 영상이 시연되었네요. 아주 사실적인 영상과 잘 유지 되는 캐릭터의 일관성이 놀랍습니다. 과연 OpenAI 라이브 행사 12일차에, Sora는 공개될까요?
2024/12/09
  • mintbear
https://slashpage.com/mintbear/SoraInLondon
Hunyuan Video by Tencent
  1. AI Video
  1. Hunyuan
2024년 12월 3일. 중국 텐센트(Tencent)는 강력한 오픈소스 비디오 생성 AI 모델, 훈위안 비디오(Hunyuan Video)를 공개했습니다.
2024/12/07
  • mintbear
https://slashpage.com/mintbear/Hunyuan-01-ref
Hailuo I2V-01-Live
  1. AI Video
  1. Hailuo
현존 가장 강력한 모델인 하이루오(Hailuo)에 새로운 2D 애니메이션 모델이 추가 업데이트 되었습니다. 일러스트, 애니메이션 캐릭터의 매력을 한층 더 살려주네요! 하이루오의 안정적인 일관성을 바탕으로, 너무나도 부드러운 움직임, 다양한 스타일의 유지, 섬세한 감정 표현까지. 너무나도 완벽합니다! 당분간 실사 보다 애니메이션 제작의 매력에 빠지게 될 것 같습니다. - 민트베어
2024/12/04
  • mintbear
Gen-3 비디오 키프레이밍 (프로토타입)
  1. AI Video
  2. Updates
  1. Gen-3
Gen-3에서 키프레이밍 업데이트를 예고했습니다. 무한히 넓은 캔버스 위에서 이미지와 비디오를 생성 및 배치하고 유기적으로 연결하여, 하나의 시퀀스로 완성해가는 웨이 포인트 작업 방식입니다. 이 기능은 마치 ComfyUI, Ideogram의 Canvas, Recraft, Supercraft, Florafauna 와 같은 캔버스 생성 프로세스를 연상 시킵니다. 앞으로 이렇게 직관적인 '콘텐츠 파이프 온 캔버스' 방식은 가장 중요한 작업 프로세스가 될 것 같습니다. 이미지와 비디오 생성과 편집 과정이 훨씬 더 편리해지겠습니다.
2024/12/03
  • mintbear
Fugatto : 오디오 혁신을 예고하는 NVIDIA 생성 AI
  1. AI Sound
  1. NVIDIA
NVIDIA가 텍스트와 오디오 프롬프트를 통해 음악, 음성, 독특한 소리를 생성하고 변환할 수 있는 새로운 생성 AI 모델 'Fugatto'를 공개했습니다. 1) 텍스트 설명을 바탕으로 음악을 생성하거나, 2)기존 음악에 악기를 추가/제거하고, 3) 억양과 감정을 변형하는 등 다양한 오디오 작업이 가능합니다.
2024/12/01
  • mintbear
대한민국AI국제영화제 대상 수상작, Mateo 온라인 상영회(이벤트 종료 / 다음 상영회를 기다려주세요)
  1. AI Video
  1. AI Films
11월 30일, 토요일 오후 2시.
AI 커뮤니티 GPTers 에서 영화 Mateo 마테오 온라인 상영회를 개최합니다.

첨부 링크에서 신청하셔요.
2024/11/30
  • mintbear
Leaked Sora Videos : 소라 API 유출 사건
  1. AI Video
  1. Sora
OpenAI의 비디오 생성 AI ’소라(Sora)’가 정식 출시 전, API가 잠시 유출되는 사건이 발생했습니다. 여러 유저들에 의해 테스트 되고 유출된 영상은 1080p 해상도의 10초 비디오들로, 시뮬레이션 퀄리티는 매우 높으나, 아직 Text-to-Video 컨트롤이 잘 되지는 않는 부분도 보였습니다. 그 이면에 숨은 이야기도 들어보셔요.
2024/11/27
  • mintbear
Leaked Sora Gallery
  1. AI Video
  1. Sora
유출된 소라 비디오 갤러리, 87개의 비디오와 프롬프트 전체
2024/11/27
  • mintbear
루마 Luma updates - with Image Tools
  1. AI Image
  2. AI Video
  3. Updates
  1. Luma
2024/11/25
  • mintbear
일반 유저를 위한 Flux.1 Tools 소개
  1. AI Image
  1. Flux
FLUX.1 Tools 는 Flux.1 사용자를 위한 Tools (: 편집 도구 모음)으로, 1 Fill, Depth, Canny, Redux 라는 네 가지 기능의 모듈로 공개 되었습니다. 이미 Stable Diffusion 에서 작동하던 기능이지만, 이제 고퀄리티 이미지의 Flux.1 를 더 다양하게 활용할 수 있게 되었네요.
2024/11/22
  • mintbear

ChatGPT 'o3' 모델을 이용한 심층 리서치(Deep Research)

Season
2025.02
Summary
[ GPTers OpenAI 워크플로우 스터디 사례 ]

최근 업데이트 된 '심층 리서치(DeepResearch)' 기능을 o3 모델에서 테스트 해봤습니다.

($200 Pro Plan)
.
Category
  1. AI LLM
  2. OpenAI
Tag
  1. Updates
Dates
2025/02/06
Created by
  • mintbear
GPTers OpenAI 워크플로우 스터디, 2025년 2월 사례글 입니다.
안녕하세요! 민트베어 입니다.
이번주 업데이트 된 심층 리서치(DeepResearch) 기능을 "o3 모델"에서 테스트 하여,
목표 1. 실제로 얼마 만큼의 깊이 있는 서치와 분석이 진행되는지 Agent AI로서의 가치와 수행 능력을 평가하고
목표 2. 수행 결과로 도출되는 'AI 이미지 도구 분석'에 대한 자료나 인사이트를 얻고자 했습니다.
진행 방법
ChatGPT의 'o3-mini-high 모델' 에서 심층 리서치(DeepResearch) 기능을 활용했습니다.
($200, Pro Plan 이용 중입니다.)

Step 1. GPT 모델 선택 & 심층 리서치 & 프롬프팅

좌상단에서 [모델]을 선택하고, 하단의 [심층 리서치] 버튼을 클릭, 아래의 프롬프트를 입력하여 수행했습니다.
🍀
현재, 일반 대중이 사용하기에 가장 적합한 AI 이미지 생성 도구에 대해 체크해줘.
기본 목록은 민트베어의 https://slashpage.com/mintbear/Best_Image_Generator 를 참고하되,
또 다른 다양한 도구들의 최근 변화를 체크해서 업데이트해줘.
현재 4o, o1, o3 모델의 여러 버전을 사용 할 수 있는데 (4o과 o1 모델은 필자가 계속 사용해왔기 때문에)
이번에는 o3 모델에 Deep Research 기능을 테스트해보기로 했습니다.
민트베어가 운영하는 이미지 생성 도구 사이트의 정보를 참고하여 진행할 것을 요청했습니다.
데이터에 대한 사용자의 의도와 가이드를 제공하는 것이 유용할 것이라 생각했어요.

Step 2. o3의 질문을 받다.

그냥 답을 주지 않았어요. 바로 질문을 하네요.
그래서 아래와 같이 답변했습니다.
🍀
모든 요소가 중요하지만, 사용자에 따라 항목에 따른 가중치가 다르니, 통합 평가로 가야 할 것 같아.
다만 일반 사용자를 설정했으니, 너무 난이도가 높은 학습곡선은 배제하고 제안해줘.
위와 같이 답변했더니 본격적인 [심층 리서치]를 수행하기 시작했습니다.

Step 3. 심층 리서치 - 추론 활동과 출처

약 5분 동안 19개의 출처에서 다양한 단계로 추론을 진행했습니다.
유의미한 심층리서치 과정을 잠깐 살펴보면 아래와 같습니다.

[ 서치와 추론 과정 ]

1.
제공된 URL에서 민트베어의 AI 이미지 도구 목록을 검토하네요.
🤖
민트베어 웹사이트의 이미지 도구를 자세히 읽음
> 슬래시 페이지를 열어 델프트의 내용을 확인 중입니다.
> 슬래시 페이지에는 미드저니, 드리미나(무료 도구?), 소라 관련 항목이 포함되어 있다고 생각하고 있음. 계속 스크롤하며 찾고 있음.
> AI 이미지 생성기 목록을 보고 있어. 이 목록은 다양한 항목으로 구분되고 있으니, 더 살펴보는 중이야.
2.
도구 리스트 중 '무료'라고 강조 표시된 것을 '추천'하고 있다고 이해합니다.
🤖
> 이 페이지는 다양한 이미지 생성기를 나열하고 있어요. 무료 옵션으로 "Dreamina"를 추천하는 중입니다.
> 다양한 이미지 생성 도구를 살펴보며, Midjourney와 DALL-E 3를 포함한 훌륭한 옵션들을 고르고 있어. Stable Diffusion 기반의 도구들도 흥미롭네.
> Midjourney와 DALL-E 3, Stable Diffusion 기반의 LeonardoAi, "DreamStudio"와 "Adobe Firefly"의 최신 동향을 살펴보고 있어.
3.
이후 관련 웹사이트를 서치하며 추론을 계속 합니다.
🤖
> 추천 도구의 특징과 장단점을 표 형식으로 비교하며, 최종 추천도를 종합적으로 제시하고 있어.
> Leonardo.ai, Midjourney, Ideogram, DreamStudio, Adobe Firefly, Canva Magic Media 등을 비교하며, 일반 사용자에게 적합한 AI 이미지 생성 도구를 분석하고 있어.
> 내용이 아래로 더 있을 것 같아 스크롤을 더 내려보고 있어.
> DALL·E 3는 사용 용이성에 중점을 두고 있고, Midjourney는 최상의 결과를 제공합니다. Ideogram은 이미지 내 텍스트 처리를, Stable Diffusion은 사용자 맞춤화를 지원하며, Adobe Firefly는 창의적인 작업에 통합됩니다. Canva 등 다른 도구도 포함될 가능성이 있습니다.> Zapier 기사와 TechRadar 보고서 를 참고하면서, 2024년에는 DALL-E 3, Midjourney, Adobe Firefly가 주목받고 있다. 이 툴들은 각각 특별한 기능을 제공하고 있어.
> 사용할 때마다 새로운 방법을 구상하며, Zapier DALL-E 3와 Midjourney의 최적화된 결과를 찾고 있어요.> 자, 해당 플랫폼에서 Zapier의 리스트를 보면, DALL·E 3는 사용이 쉽고, Midjourney는 최고의 결과를 제공하며, Ideogram은 정확한 텍스트 작성에 유익합니다. Stable Diffusion은 ... (커스터마이징과 제어 또는 오픈 소스의 가능성을 시사하며) "Leonardo for something" 또는 "Adobe Firefly for something" 또는 "Canva for quick social or integration" 등이 있습니다.
etc.
o3 Deep Research 는 이후에도 아주 흥미로운 서치와 추론을 계속했습니다.
[ 출처 표기 ]
출처는 상당히 많은 19개로 표기해주었지만, 획일적인 출처로 결과를 보고는 아쉬움이 남았습니다.
따라서 이후 서치 대상을 다양하게 요청해야 할 필요성을 알게 되었고,
실제로 다양한 레퍼런스 활용하는 것을 사후 테스트 했습니다.
하지만 추론 과정 자체는 매우 리즈너블 했고,
빈약한 근거 자료에도 불구하고 대체로 유용한 결론에 도달했습니다.

Step 4. 1차 결론 도출

o3의 1차 심층 리서치는 다양한 출처를 활용한 추론으로, 매우 유용하고 객관적인 정보를 도출했습니다.
기존 4o, o1보다 만족스러웠으나, 일반적인 인사이트에 편향적 정보가 다루어진 경향이 보였습니다.
이건 제가 전문분야이기 때문에 보이는 것이고,
비전문가가 보기에는 충분히 유용하고 확실한 정보처럼 보일 수도 있습니다.
기능의 업그레이드는 확인 되었으나,
도출된 결론에 만족하지 못해서 민트베어는 추가 질의를 이어갑니다.

Step 5. 2차 심층 리서치

답변에 가볍게 평가하고, 2차 심층 리서치를 의뢰했습니다.
🍀
온라인에 일반적 평가는 위와 같을 수 있고, 각 도구에 대한 평가나 기준은 아주 훌륭하다고 동의해.
하지만 최근 실시간 변화를 체크하고 있는 민트베어 개인의 견해로는 Ideogram, Leonardo, DreamStudio 보다는
Krea, Recraft, Dreamina, Freepik, 그리고 비디오 생성도구였지만, Kling에서 지원하는 KOLORS 1.5 와 같은 이미지 모델도 유용하다고 생각해.
위의 기본 평가는 유지하되, 현재 민트베어의 의견을 반영하여, 다시 서치하고 검토한 다음에 그 근거를 바탕으로 다시 결론을 도출해줘. (심층 리서치)

Step 6. o3의 추가 질문을 받다.

[심층 리서치]를 요청하니, 이번에도 후속 질문을 받았습니다.
🤖
ChatGPT o3 : 좋은 의견 감사합니다. 민트베어님의 최신 견해를 반영하여, Ideogram, Leonardo, DreamStudio 대신

Krea, Recraft, Dreamina, Freepik, 그리고 Kling의 KOLORS 1.5 모델을 포함한 AI 이미지 생성 도구를 심층적으로 조사하겠습니다.
이 연구에서 중점적으로 고려할 사항이 있을까요? 예를 들어: 특정 기능(예: 스타일 조절, 해상도, 편집 기능) 강조 유료 vs. 무료 모델 비교 이미지 생성 속도 및 품질 테스트 결과 최근 업데이트 및 기술적 변화 분석 이러한 점을 포함하여 분석하면 더욱 구체적인 결과를 도출할 수 있습니다.
사용자의 의도와 구체적인 정보를 체크하려는 태도가,
정말 스마트하고 열정적인 신입 사원의 눈빛을 마주하는 것만 같았어요. 😺
질문도 매우 구체적이고, 이전의 심층 리서치를 통해서 포인트를 정확하게 잘 짚어내는 것이 보였습니다.

저는 기쁜 마음으로 의견과 가이드를 제공하였습니다.
사용자 전문분야의 경우, 구체적인 범주를 구체화하여 제공할 수 있으므로 대화의 품질이 올라갑니다.
🍀
이전과 유사한 통합적 평가를 해야 할 거야. 대신 언급한 스타일과 해상도는 큰 문제가 되지 않고, 부수적으로 생성 이미지에 대한 편집기능이 제공되는 것은 매우 중요하지.
유료/무료인 경우에는 그 것에 따른 효용성과 가치 등을 평가해주고, 이미지 생성 속도는 최근 거의 문제가 되지 않아. 그러니 이미지 생성 속도 보다는 품질 면에서 미학적 아름다움과 현실적이거나 사실적인 이미지 연출, 프롬프트에 대한 반응성 등을 평가해서 사용자에게 얼마나 유용한 이미지가 생성되는지에 대해 복합적으로 평가해야 해.
마지막 최근 업데이트는 빠른 속도로 지속하고 있는 포인트와 최근의 유용한 기능 업데이트도 선택의 기준이 될 수 있을 것 같아. 부디 이 복잡한 기준을 잘 설정해서 진행해주길 바래. 고마워.

Step 7. 2차 서치와 추론

이후에도 아주 효과적인 분석과 추론을 이어갔습니다. (이후 추론 정리 생략)

결과와 배운 점

o3 & Deep Research는 매우 강력했습니다.
4o, o1 레벨에서 경험했던 추론 레벨이 아닌
o3 만의 차별화 된 격이 있었고,
Agent 레벨에 진입한, 강력한 자기주도 학습 AI의 스타일을 확인하였습니다.
확실히 같이 일하고 싶은 동료랄까요.
때로 레퍼런스 문제 등으로 한계가 있을 수 있으나
사용자로부터 명확한 가이드가 제공되면, 정말 강력한 추론과 접근 방식을 구현했습니다.
이후에도 다른 주제로 계속 활용중이며,
피상적 내용이 아닌 보다 구체적이고 전문적인 논의에서 매우 놀라운 경험을 하고 있습니다.
과거 Search 기능을 비롯한 여러 기능 제약으로 한계를 보여주던 o1을 넘어
이제 o3는 묶여있던 사슬을 풀고, 마치 세상으로 달려나오는 느낌을 줍니다.
또한 현재 이미지 생성 도구들에 대한 가치있는 추론을 나눌 수 있는 것은 귀한 경험이었습니다.
2025.02.06 OpenAI WorkFlow
AI Visual Director, 민트베어
👍