AI Speed Box

AI 뉴스와 정보 링크 모음 ( 민트베어의 무지성 스크랩, 숙성시켜 Visual AI News가 됩니다.)
All
AI Image
AI Video
AI Sound
AI LLM
AI 3D
AI
AR, XR, VR
AI Toons
AI SNS
FLUX. Kontext
  1. AI Image
  1. FLUX
http://playground.bfl.ai/image/edit
2025/05/27
Available Now (사용 가능)
Kling 클링 3월 업데이트 - UI, 사운드효과(SFX), 폴더 기능(Assets), 비디오 연장(Extend), 봄꽃효과(Bloom Effect)
  1. AI Video
  1. Kling
1️⃣ 클링 UI가 더 쉽게 업데이트 되었습니다.
2️⃣ 에셋(Assets)에서 '폴더'를 관리 할 수 있어요. 이제야 좀 편해졌군요.
3️⃣ 사운드 이펙트(SFX) 생성 기능이 도입되었어요.
4️⃣ 비디오 연장(Extend) 기능이 Kling 1.6 버전에도 도입되었어요.
5️⃣ 봄맞이 벚꽃 피어나는 효과가 추가 되었습니다. 무드는 좋은데, 완성도가 높지는 않아요.
2025/03/27
Available Now (사용 가능)
미드저니, 폴더 기능 업그레이드 Midjourney FOLDER!
  1. AI Image
  1. Midjourney
웹사이트에 새로운 폴더 및 조직 시스템 도입
생성 및 정리 페이지에 신규 폴더 메뉴 제공
폴더를 열람 시 새로 생성한 이미지가 자동 추가
관련 프로젝트나 아이디어별로 폴더 그룹화 가능
하나의 이미지를 여러 폴더에 추가할 수 있으며 라이트박스에 표시
우클릭 메뉴로 폴더 내 모든 이미지 한 번에 다운로드 가능
우클릭, 드래그 앤 드롭, 또는 라이트박스 내 폴더 버튼을 통한 이미지 추가 지원
https://www.midjourney.com/updates
2025/02/21
Available Now (사용 가능)
제보 : AIBRAHAM
Hailuo Effects
  1. AI Video
  1. Hailuo
Pika의 Pikaffect, Kling Effects에 이어 Hailuo도 재미있는 Effects를 준비했네요. 흥미롭고 재미있는 쿠키샷은 놓칠 수 없는가 봅니다. 잔잔한 즐거움에 좋아요.
2025/02/14
Available Now (사용 가능)
Adobe Video AI : FIREFLY ! 어도비에서 비디오 AI가 출시되었습니다.
  1. AI Video
  1. Adobe Firefly
드디어 오늘, Adobe Firefly : Video AI가 출시되었습니다.

기존의 이미지 생성 AI 모델인 Firefly 에 드디어 비디오 AI 모델이 도입된 것인데요, 텍스트 또는 이미지를 기반으로 비디오 콘텐츠를 제작할 수 있습니다.

제가 주목하는 이유는 : 지구상에 존재하는 거의 모든 디자이너가 사용하고 있는 Adobe Photoshop 때문이죠. 그리고 비디오 편집 프로그램인 Adobe Premiere Pro에도 연동 될 것이기 때문입니다.

실제로 Creative Cloud 로 도구간 데이터 연동이 되고, 시연에서도 Photoshop, Premiere Pro, AfterEffect, Express 와 연동하여 다양한 시연을 보여주었습니다.

내부 학습 데이터 덕분에 저작권 이슈에서도 안정적인 Adobe Firefly. 체크해보겠습니다.
https://firefly.adobe.com/upload/video-generation
https://projectneo.adobe.com/
2025/02/12
제보 : Picassong
OpenAI 리브랜딩
  1. AI LLM
  1. OpenAI
  2. ChatGPT
OpenAI가 서체, 워드 마크, 심볼, 컬러 팔레트를 비롯한 UI 리브랜딩을 했네요.
공식 웹사이트가 리뉴얼 되었고, 모바일 앱 업데이트시 폰트와 UI에 약간의 개선이 있습니다. 깔끔합니다.
사용상의 편리성은 모바일 웹에서 심층리서치와 canvas가 작동하는 것이 확인됩니다. (Pro Plan)

영상은 각 파트별로 구분해두었습니다.

1) Design Principle
2) Typography
3) Word Mark
4) Logo
5) Color
6) Tone
7) Layout & Application
https://youtu.be/k3d_xeVxEOE?si=6bkqvOmxlA7-ZJXB
2025/02/05
Available Now (사용 가능)
제보 : 곽은철 님
Kling - 모델 이미지/영상 만들기 (by 피카쏭 님)
  1. AI Video
  1. Kling
'피카쏭'님께서 초보를 위해 만들어주신 Kling KOLORS 1.5 로 모델 영상 만들기

최근 Kling에 업데이트 되고 있는 여러 기능들이 도구의 활용성을 바꾸어 놓고 있습니다.

아래는 미드저니에서 만든 모델을 - 클링에서 본격 활용하는 피카쏭님의 사례입니다.

처음 사용하는 분들을 위해 사용법도 영상으로 정리해주셨네요!
https://www.threads.net/@picassong.ai/post/DFhP_mTTBpz?xmt=AQGzZJuRqGTx_s3vxpeasPCNn5LpSo5lMbDv2lQ1Gv1HuA
2025/02/01
Available Now (사용 가능)
제보 : Picassong
👍
1
🎥 Hailuo T2V-01-Director : 카메라 컨트롤
  1. AI Video
  1. Hailuo
한국은 설연휴이지만, AI는 오늘도 쉬어가질 않는군요. 저도 어느새 노트북 앞에 앉아있네요 😂

Hailuo에서 카메라 컨트롤이 업데이트 되었습니다. 기존의 Gen3, Kling, Luma 처럼 텍스트 프롬프트로 카메라 무빙 연출이 가능해졌습니다.

그런데, 언제나 프롬프트 통제력이 강력했던 Hailuo지만, 이번 카메라 컨트롤링은 정말 미쳤습니다. 원하는 대로 카메라가 움직이네요.

이번 베이직 비디오 클래스에서는 이것을 포함하겠습니다.
https://hailuoai.video
https://hailuoai.video/discover/340552170451558409
https://x.com/Hailuo_AI/status/1884176446702428568
2025/01/28
Available Now (사용 가능)
1
👍
1
" 2025년, 새해 AI 받으세요! "
  1. AI LLM
  2. AI Image
  3. AI Video
  4. AI Sound
  1. mintbear
  2. OpenAI
  3. ChatGPT
  4. DALLE
  5. Midjourney
  6. Hailuo
민트베어의 AI 리터러시 시리즈, 매주 금요일 저녁. 3주간 진행되는 AI 장벽 낮추기

2025.01.31 AI 챗지피티 : 기초반
2025.02.07 AI 이미지 : 기초반
2025.02.14 AI 비디오 : 기초반
https://event-us.kr/monthly/event/98314
https://slashpage.com/2025AI
2025/01/26
Available Now (사용 가능)
OpenAI 에이전트 : 'Operator'
  1. AI
  1. OpenAI
OpenAI에서 자동화 작업 수행 에이전트 ‘오퍼레이터’를 발표했습니다.

우선은 미국의 Pro($200) 유저만 테스트 가능하지만, 곧 전 세계로 확대 공개될 예정입니다. 이제 일상적으로 개인용 또 비니스용 오퍼레이터를 사용하게 될 것 같아요.

이제 자동으로 처리되는 업무와 일상을 상상하고 준비하셔요.

편리함도 편리함이지만, 사무직 긴장합시다... 🍀🧸
https://openai.com
https://youtu.be/V8BSApvy3e8?si=QWuPwehLpEsx8D4K
https://openai.com/index/introducing-operator/
2025/01/24
Limited Release (일부 공개)
OpenAI
Kling - KOLORS 이미지 레퍼런스
  1. AI Video
  1. Kling
비디오 생성 도구인 Kling 에
이미지 생성 도구인 KOLORS 1.5가 있습니다. 아주 유용!

KOLORS 1.5 의 이미지 퀄리티도 상당히 좋아졌는데,
최근 "이미지 레퍼런스" 기능이 탑재 되었습니다.

미드저니에서 만든 캐릭터를 업로드하고,
원하는 방식으로 베리에이션하기에 아주 좋습니다.
2025/01/24
Available Now (사용 가능)
Kling Elements ! (여러 캐릭터, 동시 등장!)
  1. AI Video
  1. Kling
Kling Elements! 🍀🧸

사용자가 최대 4개의 이미지를 결합하여 일관된 캐릭터, 환경 또는 객체를 포함한 비디오를 생성할 수 있도록 합니다. (이 기능은 현재 선택된 창작 파트너에게 조기 접근이 제공되고 있습니다.)

사용자는 여러 정적 이미지를 통합하여 시각적으로 매력적인 애니메이션 시퀀스를 제작할 수 있습니다.
https://klingai.com
https://klingai.com/release-notes
2025/01/21
Limited Release (일부 공개)
제보 : Picassong
2
😍👍
2
Edits : 인스타그램 AI 비디오 (3월3일 예정 Meta, MovieGen)
  1. AI Sound
  2. AI SNS
  1. Edits
  2. _Meta
  3. MovieGen
https://apps.apple.com/kr/app/edits-an-instagram-app/id6738967378
2025/01/20
Coming Soon (출시 예정)
제보 : Picassong
Krea 3D .. 대애박! (3D 캐릭터 실시간 렌더링)
  1. AI Image
  2. AI 3D
  1. Krea
2025.01 현존 최강 캐릭터 모델링 도구 : Krea 입니다.

Krea 테스트를 계속해오고 있었는데
강의와 스터디 일정으로 포스팅이 늦었습니다.

이제 Krea.ai 에서 2D 모델을 3D 모델로 변환하고,
동시에 실시간 렌더링 할 수 있습니다.

Krea : Train Model + Convert 3D + Realtime Rendering

심지어 프롬프트와 구성요소, 배경 이미지를 실시간으로 교체해가며
변화하는 렌더링 결과를 실시간으로 확인할 수 있습니다.
업스케일과 이미지 출력은 당연히 되구요.

차기 강의에서는 Midjourney & Krea & Hailuo 를 주축으로 갈게요.
https://www.krea.ai/train
2025/01/17
Limited Release (일부 공개)
👍
2
Kling - 프롬프트 딕셔너리, 프리셋 기능 도입
  1. AI Video
  1. Kling
Kling - Prompt Dictionary, Preset
클링에도 프롬프트 딕셔너리와 프리셋이 들어왔습니다.
https://t.co/YRa5fjEPxP
2025/01/15
2025 AI 시대의 인간지능 컨퍼런스
  1. AI
  2. AI Image
  3. AI Video
  4. AI Sound
  1. mintbear
2025년 1월 12일 일요일, 민트베어가 참여하는 인간지능 컨퍼런스에 함께해주세요. 강남 슈피겐홀
https://smartstore.naver.com/lolomall/products/11207388755
2025/01/12
행사 종료
Kling Effects
  1. AI Video
  1. Kling
Pika 기능을 차용해 왔네요 :)
2025/01/10
AI토크 유튜브 : OpenAI 워크 플로우
  1. AI
  2. AI LLM
  3. AI Image
  4. AI Video
  1. OpenAI o1
  2. Sora
지피터스 스터디에서 민트베어가 진행한 워크플로우 스터디 AI토크 영상입니다 (신청기간 1월 10일까지)
https://youtu.be/PS_rywAnm2k?si=CXX1otWli7LP3Gme
2025/01/07
Available Now (사용 가능)
Kling - 이미지 KOLORS 1.5 업데이트 & EndFrame & Virtual Try-On & LipSync updates
  1. AI Video
  2. AI Image
  1. Kling
1️⃣ KOLORS 1.5 : Kling 이미지 모델인 KOLORS 1.5의 프롬프트 반응성 및 이미지 사실성, 정교함이 향상되었습니다.
2️⃣ AI Virtual Try-On : (텍스트 프롬프트로 고품질 AI 모델을 생성할 수 있는) AI 모델 기능이 AI Virtual Try-On에서 사용 가능합니다. 학습된 모델에 자연스러운 의상 적용 가능.
3️⃣ KLING AI 1.5 : End Frame만으로 5초 또는 10초 길이의 동영상을 생성 기능이 업데이트 되었습니다.
4️⃣ Lip Sync : 고품질 음성 2개와 7가지 감정 선택 기능이 추가되어 캐릭터의 생동감을 극대화할 수 있습니다.

KOLORS 1.5는 이미지 품질, 구도, 조명이 더욱 개선되었으며, AI Virtual Try-On 기능을 통해 자연스럽고 사실적인 의류 디스플레이 동영상을 제작할 수 있습니다. 일부 새로운 기능은 KLING AI 1.6 업데이트에서 지원 예정.
2024/12/27
Available Now (사용 가능)
Voice Cursor
  1. AI Sound
  1. ETC sound
Gemini 에서 수동 프롬프트로 감정을 담은 더빙을 사용 중이었는데, 이것을 자동화하는 코드가 공개되었네요.
https://twitter.com/trudypainter/status/1870230202703589758
https://github.com/googlecreativelab/gemini-demos/tree/main/voice-cursor
http://localhost:3000/
2024/12/22
Available Now (사용 가능)
포토샵(베타) 새기능 : Select Body Parts
  1. AI Image
  1. Adobe Photoshop
포토샵의 새로운 기능인 “Select Body Parts”는 개체선택(Object Selection) 도구의 업그레이드 기능으로, 인공지능을 활용하여 사람의 신체 부위를 쉽게 선택할 수 있게 해줍니다. 포토샵(베타)에서 업데이트 하고 사용하세요.
https://youtu.be/Dxk-qlxUJTg?si=zjRIuuLCJmDHxRHe
https://www.threads.net/@abraham_slothero/post/DDwHpEwTvNL?xmt=AQGzQb9dwh1KFNnIfN5N2vD6Lc-Dww4SMq4sK7ia9I2NSw
https://helpx.adobe.com/kr/photoshop/using/photoshop-beta-desktop-app.html
2024/12/19
Available Now (사용 가능)
제보 : AIBRAHAM
Kling 1.6 업데이트
  1. AI Video
  1. Kling
KLING AI 1.6 업데이트 : 프롬프트 대응성 개선, 더 일관적이고 역동적인 결과 / 표준 및 프로페셔널 모드를 지원하며, KLING 1.5 모델 대비 전체적으로 195% 향상된 성능을 제공. / 프롬프트 대응성 향상: 동작, 순차적인 움직임 / 카메라 움직임 등에 대한 프롬프트 반응 개선 및 시작 프레임에 없던 요소 생성 능력 강화. 카메라 무브 및 모션브러시 미작동 -- Sora와 VEO2 출시와 함께 모든 비디오 생성 도구들이 바짝 긴장하는 듯하네요.
https://klingai.com/release-notes
https://twitter.com/Kling_ai/status/1869599147046871488
https://klingai.com
2024/12/19
Available Now (사용 가능)
👍
1
Ideogram Batch Generation
  1. AI Image
  1. Ideogram
https://twitter.com/ideogram_ai/status/1869074020131287443?s=46
2024/12/18
Available Now (사용 가능)
Midjourney Office Hours (2024-12-18)
  1. AI Image
  1. Midjourney
최근 업데이트 Patchwork, Moodboards, Profile / v7 2025년 1월 예정 / 대량 이미지 생성 가능한 Batch 8 준비중.
https://twitter.com/blackowl777/status/1869499353045324127
2024/12/18
Coming Soon (출시 예정)
Veo 2
  1. AI Video
  1. _Google
4K... ㄷㄷ
https://blog.google/technology/google-labs/video-image-generation-update-december-2024/
https://labs.google/fx/tools/whisk/unsupported-country
https://deepmind.google/technologies/veo/veo-2
2024/12/17
Coming Soon (출시 예정)
Midjourney Moodboards
  1. AI Image
  1. Midjourney
2024/12/17
Available Now (사용 가능)
Googles New AI Glasses (Android XR)
  1. AR, XR, VR
  1. _Google
구글은 삼성과 퀄컴 협력을 통해 확장현실(XR) 플랫폼인 안드로이드 XR을 발표했습니다. Gemini AI를 기반으로 헤드셋과 안경을 통해 현실을 확장하고 새로운 방식으로 탐색, 연결, 창작을 가능하게 하는 플랫폼입니다. Apple Vision Pro 와의 또 다른 대결 구도가 기대됩니다. 언제냐일 뿐, 시장의 방향은 정해져 있어요.
https://blog.google/products/android/android-xr/
2024/12/16
Coming Soon (출시 예정)
비디오 워터마크 기술, Meta Video Seal
  1. AI Video
  1. _Meta
메타(Meta)가 새로운 워터마크 기술 "Meta Video Seal"을 공개했습니다. 이 기술은 영상에 보이지 않는 워터마크를 삽입해, 저작권 보호와 출처 추적을 가능하게 합니다. 이 워터마크는 영상이 흐려지거나 잘리더라도 유지되며, 압축 과정을 거쳐도 손상되지 않습니다. 필요할 경우 특수 도구를 사용해 워터마크를 추출하고, 영상의 출처를 쉽게 확인할 수 있습니다.
https://aidemos.meta.com/videoseal
https://github.com/facebookresearch/videoseal
https://news.abplive.com/technology/meta-new-open-source-tool-video-seal-watermark-ai-generated-videos-what-we-know-1737694
2024/12/15
Available Now (사용 가능)
Pika 2.0 업데이트
  1. AI Video
  1. Pika
AI 비디오 생성 도구 Pika 2.0 이 출시 되었습니다. 피카 2.0 버전 및 상업적 이용은 Pro Plan($35)에서만 사용 가능합니다. 다양한 템플릿과 Scene Ingredients 조합으로 다양한 스타일의 비디오를 쉽게 제작할 수 있게 되었네요. 프롬프트가 결과물에 더 정확히 반영되는 듯 합니다.
https://pika.art
https://pika.art/pricing?interval=month
2024/12/15
Available Now (사용 가능)
Motivo by Meta
  1. AI 3D
  1. _Meta
메타 모티보는 디지털 아바타의 전신 동작을 자연스럽게 제어하는 AI 모델로, 메타버스와 VR 환경에서 인간다운 움직임과 상호작용을 구현합니다. 비지도 강화학습과 혁신적 알고리즘을 통해 추가 훈련 없이 다양한 작업 수행이 가능하며, 환경 변화에도 높은 적응력을 제공합니다. 메타버스, 게임, VR 등에서 몰입감과 현실감을 크게 높일 기술입니다.
https://metamotivo.metademolab.com/
https://metamotivo.metademolab.com/demo
2024/12/15
Available Now (사용 가능)

OpenAI 에이전트 : 'Operator'

Category
  1. AI
Gen
  1. OpenAI
Date
2025/01/24
Summary 🍀🧸
OpenAI에서 자동화 작업 수행 에이전트 ‘오퍼레이터’를 발표했습니다.

우선은 미국의 Pro($200) 유저만 테스트 가능하지만, 곧 전 세계로 확대 공개될 예정입니다. 이제 일상적으로 개인용 또 비니스용 오퍼레이터를 사용하게 될 것 같아요.

이제 자동으로 처리되는 업무와 일상을 상상하고 준비하셔요.

편리함도 편리함이지만, 사무직 긴장합시다... 🍀🧸
URL
https://openai.com
URL
https://youtu.be/V8BSApvy3e8?si=QWuPwehLpEsx8D4K
URL
https://openai.com/index/introducing-operator/
Release
Limited Release (일부 공개)
제보자
OpenAI
2025.01.24 - 페이지 계속 업데이트 됩니다.
드디어 AI Agent의 초기 모델이 등장했습니다. AI가 단순한 도구에서 → 결정과 실행을 지원하는 파트너로 자리 잡아가는 시기입니다. 흥미로운 기술 먼저 체크하시고, 이후 일상과 업무가 변화하는 모습을 상상하고 준비해 보세요. 추상적인 이야기, 또는 더 이상 먼 미래의 일은 아닙니다.
2025.01.24 민트베어
여러분의 모든 업무는 안녕하신가요?
OpenAI Operator, 또는 AI 에이전트가 2025년 모든 업무나 인간 고유의 역할을 대체하진 않을 거에요. 하지만 단순히 모방 가능한 업무나 영역은 빠르게 대체 되기 시작하겠죠.
AI에 대해 사전 대응이나 학습이 권장되지 못하는 분야, 그리고 정보 소외 계층이 걱정입니다. 이 우려는 안내문이나 인터페이스 개선, 도우미를 배치하여 해결을 기대하는 키오스크 문맹률 수준의 것은 아닐 거에요. 저 또한 시작하지 않으면 AI 문맹이 될 것이라 상상하며 AI 공부를 시작했죠.
제가 아직도 많은 시간을 투자하는 단편적인 시장조사, 자료수집, 자료정리, 초안작성, 단순 포스팅 과정은 바로 에이전트와 함께 하려 합니다. 일반 기업의 각 담당자도, 우리 일상 속에서도 이렇게 시작하시면 될 거에요. 그런데 그 작은 사용에 따른 시간과 효율 격차는 상당히 벌어질 겁니다.
2025.01.25 민트베어

[한국어 자막] OpenAI 발표 영상

박준님께서 거의 실시간으로 번역해주신 OpenAI Operator 발표 영상

유튜브 요약 (Lylis)

Operator의 주요 특징

자동화된 작업 수행: Operator는 레스토랑 예약, 콘서트 티켓 구매, 온라인 쇼핑 등 다양한 웹 기반 작업을 자동으로 수행할 수 있습니다.
컴퓨터 사용 에이전트(CUA) 모델: Operator는 OpenAI의 GPT-4o 모델의 시각적 능력과 강화 학습을 통한 향상된 추론 능력을 결합한 CUA 모델을 기반으로 합니다.
브라우저 조작: 스크린샷을 통해 웹페이지를 “보고” 마우스와 키보드 동작을 통해 “상호작용”할 수 있습니다.
자체 수정 능력: 문제에 직면했을 때 추론 능력을 활용하여 스스로 수정할 수 있습니다.

활용 사례

식당 예약(예: OpenTable)
온라인 장보기(예: Instacart)
티켓 예매(예: StubHub)
각종 배달 주문(예: DoorDash, Uber 등)
청소·수리 서비스 예약(Thumbtack 등)
온라인 쇼핑(타겟, eBay 등)
이 외에도 사이트 API가 없어도 웹 브라우저만 있으면 가능한 모든 작업에 적용 가능.

사용 방법 및 가용성

ChatGPT Pro 구독자 대상: 현재 미국 내 ChatGPT Pro 구독자($200/월)에게 제공되고 있습니다.
간단한 사용법: 사용자는 수행하고자 하는 작업을 설명하면 Operator가 나머지를 처리합니다.
사용자 개입: 필요한 경우 사용자가 언제든지 제어권을 가져올 수 있습니다.

협력 및 개인정보 보호

OpenAI는 여러 기업들(DoorDash, Instacart, Priceline, StubHub, Uber 등)과 협력하여 Operator가 이들 비즈니스의 규범을 존중하도록 하고 있습니다.
사용자는 개인정보 설정에서 “한 번의 클릭”으로 모든 브라우징 정보를 삭제하고 모든 웹사이트에서 로그아웃할 수 있습니다.
Operator의 출시는 AI 기술이 단순한 모델 개발을 넘어 실용적인 자동화 솔루션으로 발전하고 있음을 보여주는 중요한 이정표입니다. 이는 다양한 산업 분야에 걸쳐 생산성 향상과 효율성 증대를 가져올 것으로 기대됩니다.

한국은 아직 대기 중

1차 공개 국가는 미국입니다. 지금은 미국 내 Pro Plan ($200) 유저만 테스트 가능하고, 이후 전 세계로 공개 확대 될 예정입니다.
한국에 공개되어도, $200달러의 구독료를 지불하는 Pro 계정에 먼저 제공 될 거에요. 물론 시간이 조금 더 지나면 모두에게 공개되고, 또 저렴한 라이트 버전이 공개되긴 할 겁니다.

레스토랑 예약 : 오픈테이블에서 식당 예약하기

🍽️
식당 예약 (OpenTable)
“Beretta라는 레스토랑에 2인 예약을 잡아줘”라고 지시.
Operator가 웹 브라우저(원격)에서 OpenTable 사이트를 열어, 예약 가능 시간을 탐색.
사용자가 설정한 지역(샌프란시스코) 정보 등을 고려해 적절한 시간을 찾고, 만약 해당 시간이 없으면 다른 시간을 제안.
예약 완료 직전에 사용자의 ‘확인(confirmation)’을 받아 최종 예약을 진행

식료품 구매 : 메모한 글자를 인식하고 온라인에서 자동 구매

🛒
온라인 장보기 (Instacart)
종이 메모 또는 사진(“달걀, 시금치, 버섯, 닭다리살, 칠리 크런치”)을 업로드하면, GPT-4의 이미지 인식 기능으로 자동 텍스트 추출.
Operator가 Instacart 웹사이트를 열어, 필요한 식품들을 검색 후 장바구니에 담음.
사용자는 특정 가게(예: “Gus’s Market”) 등을 지정할 수도 있고, 지정하지 않으면 Operator가 웹 검색 등을 통해 알아서 진행.
사용자와 Operator 간에 “사용자 직접 브라우저 조작(Take Control)” 모드를 통해 장바구니 수량 조절 가능.
온라인에서 단계별 다중 작업하는 오퍼레이터 : 티켓 예매, 공간 예약, 청소 서비스 예약, 피자 주문
🏀
티켓 예매 (StubHub)
“이번 주말 샌프란시스코에서 열리는 농구 경기(워리어스 경기) 티켓 4장 구해줘. 좌석당 500달러 이하, 좋은 자리만 골라줘.”
Operator가 StubHub 접속 후, 조건에 맞는 자리 목록을 보여주고, 최종 구매 전 사용자에게 다시 확인을 요청.
사용자 로그인이 필요한 경우, 직접 로그인 정보를 입력해야 하며(Operator는 사용자가 takeover하여 브라우저에 입력하는 과정을 볼 수 없음), 그 후 Operator가 구매 프로세스 진행을 돕는다.
🎾
테니스 코트 예약
“가까운 테니스 코트 예약해줘” 같은 간단한 지시.
사이트 API가 없는 경우에도, 일반 사용자가 하듯 브라우저와 검색엔진을 통해 사이트를 찾고, 원하는 코트를 예약.
🧹
집안 청소·서비스 예약
청소, 이사 등 각종 생활 서비스를 예약. 시연 예시로 “청소서비스 예약”도 명령 가능.
🍕
피자 주문 (DoorDash)
“피자를 주문해줘. 바비큐 맛이 포함된 여러 종류, 중간 사이즈. 가게가 닫혀 있으면 비슷한 가게로 대체해줘” 등 구체 조건을 입력.
Operator가 DoorDash에 접속해 메뉴를 고르고, 장바구니 결제 전 다시 사용자에게 확인받음.
사례 정리는 AI 이미지/비디오 커뮤니티 Lumios.X 님께서 제공해주신 자료 활용하였습니다.

Operator 사례 모음 | 민트베어

2025.01 민트베어는 GPTers 에서 [ OpenAI 워크플로우 스터디 ] 를 운영하고 있습니다.
2025.01.24 - 페이지 계속 업데이트 됩니다.
👍
You do not have permission to write comments