AI Speed Box

AI 뉴스와 정보 링크 모음 ( 민트베어의 무지성 SNS 스크랩, 숙성시켜 Visual AI News가 됩니다.)
All
AI Image
AI Video
AI Sound
AI LLM
AI 3D
AI
AR, XR, VR
AI Toons
AI SNS
© 2024.07 mintbear. All Rights Reserved.
Gen-3 Video Prompt Book

Google DeepMind just dropped Genie 2

Category
  1. AI Video
Gen
Empty
Date
2024/12/05
Summary 🍀🧸
Google DeepMind가 방금 (게임 월드 시뮬레이터) Genie 2를 출시했습니다. AI는 이제 단 하나의 이미지나 텍스트로부터 다양하고 대화형 3D 세계를 창조할 수 있습니다.
URL
https://x.com/minchoi/status/1864439424794198291
URL
https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/
Release
Available Now (사용 가능)

Sample Videos

Genie 2: A large-scale foundation world model

Genie 2: A large-scale foundation world model
Generating unlimited diverse training environments for future general agents
deepmind.google

Summary by GPT

Google DeepMind에서 개발한 Genie 2라는 새로운 대규모 세계 모델에 대한 설명입니다. 주요 내용은 아래와 같습니다:

Genie 2 소개 및 개요

Genie 2는 다양한 액션을 제어할 수 있는 3D 환경을 생성하여 인간 또는 AI 에이전트가 키보드와 마우스를 통해 플레이할 수 있는 모델입니다.

이는 특정 프롬프트 이미지에 기반하여 새롭게 상호작용 가능한 가상 세계를 만들어내며, AI 또는 인간의 행동을 시뮬레이션합니다.

Genie 2의 주요 기능

다양한 환경 생성: Genie 2는 다양한 3D 환경을 생성하여 일반 에이전트의 훈련과 평가를 위한 무한한 커리큘럼을 제공합니다. 이는 제한적인 환경에서 발생할 수 있는 에이전트 훈련의 병목을 해결하는 역할을 합니다.
빠른 프로토타이핑: Genie 2는 인터랙티브한 경험을 빠르게 시제품화할 수 있어, AI 연구자들이 새로운 환경에서 빠르게 실험할 수 있게 합니다.
액션 제어: 키보드 입력을 통한 행동을 수행하며, 예를 들어 화살표 키로 로봇을 조작하거나 물체를 상호작용하는 등의 기능을 제공합니다.
물리적 상호작용 및 캐릭터 애니메이션: 물체 상호작용(예: 문 열기, 풍선 터뜨리기), 캐릭터 애니메이션, 중력 및 조명 효과, 반사, 물 효과 등을 모델링합니다.

기술적 발전 및 응용

오토레그레시브 라텐트 디퓨전 모델: Genie 2는 오토레그레시브 라텐트 디퓨전 모델로, 비디오 데이터를 기반으로 학습하며, 프레임 단위로 행동과 과거 프레임을 바탕으로 시뮬레이션합니다.
SIMA 에이전트: Genie 2를 통해 생성된 환경에서 자연어 지시를 통해 3D 게임 세계에서 임무를 수행하는 SIMA라는 에이전트를 훈련합니다. SIMA는 Genie 2가 생성한 환경에서 지정된 행동을 수행하고 평가를 돕습니다.

책임 있는 기술 개발

책임 있는 개발: Genie 2는 대규모 세계 모델을 기반으로 다양한 3D 환경을 생성하는 데 있어 윤리적인 사용을 지향하며, 온라인 및 현실에서 유용한 방식으로 AI 에이전트가 임무를 수행할 수 있도록 연구를 진행하고 있습니다.

미래의 발전 가능성

Genie 2는 AGI(인공지능의 일반화)로 나아가기 위한 중요한 진전으로 평가되며, 구조적인 문제를 해결하는 데 중요한 역할을 할 것으로 기대됩니다.

요약

Genie 2는 단일 프롬프트를 기반으로 다양한 3D 환경을 생성하고, 이를 통해 AI와 인간이 상호작용할 수 있는 새로운 방식의 세계 모델입니다.

게임을 통해 AI의 학습과 평가를 지원하며, 다양한 물리적 상호작용 및 액션 제어 기능을 포함하고 있습니다.
또한 빠른 환경 시제품화와 대규모 학습을 통해 AI 연구 및 창작 과정의 혁신을 추구하고 있습니다.

이 연구는 아직 초기 단계이지만, AI 연구에 있어 다양한 응용 가능성과 큰 발전 가능성을 보여주고 있습니다.
👍
Made with SlashPage