Share
Sign In
AI 트렌드 피드
애플, 일부 GPT-4·제미나이 능가하는 '이미지-텍스트' 모델 공개
V
Vice_Versa
👍
1
Created by
  • V
    Vice_Versa
Created at
💬
애플, 300억 매개변수를 가진 최신 이미지-텍스트 멀티모달 모델 'MM1'을 공개
'MM1'이 이미지를 읽고 답하는 내용, 출처 : arXiv
애플이 공개한 최고 성능의 이미지-텍스트 멀티모달 모델은 300억 매개변수를 자랑하며,
이미지를 읽고 자연어로 설명하는 능력에서 기존의 오픈AI 'GPT-4' 및 구글 '제미나이 울트라'와 같은 경쟁 모델을 일부 분야에서 추월했다고 합니다.
이 대형 멀티모달 모델은 이미지 생성 능력은 없지만, 이미지 인코더와 비전-언어 커넥터를 활용해
다양한 사전 훈련 데이터를 통해 고성능을 달성하기 위한 방법과 통찰을 제공합니다.
연구진은 이미지 해상도와 토큰 수를 중요한 요소로 보면서,
이미지와 텍스트 데이터의 혼합을 통한 벤치마크 최고 성능 달성의 중요성을 강조했습니다.
MM1 모델은 이미지 인식, 읽기, 기본 계산 등 복잡한 문제 해결에 뛰어난 성능을 보여,
현 최고 수준의 AI 기술을 한 단계 더 발전시키는데 기여했습니다.

애플은 이러한 성과를 바탕으로 AI 연구 및 개발에 본격적으로 나서,
온디바이스 AI 구축을 위한 전용 칩과 최적화된 기술을 개발하고,
최근에는 10억 달러를 투자해 제품 라인업 전반에 생성 AI를 도입하려는 계획을 밝혔습니다.
<원문 링크>
Subscribe to 'viceversa-ai'
Welcome to 'viceversa-ai'!
By subscribing to my site, you'll be the first to receive notifications and emails about the latest updates, including new posts.
Join SlashPage and subscribe to 'viceversa-ai'!
Subscribe
👍
1
Vice_Versa
AI 스토리 창작 플랫폼 ‘제타’에서 유명 캐릭터와 대화하기
스캐터랩, 사용자 맞춤형 AI 스토리 창작 플랫폼 ‘제타’ 출시 한때 이루다(AI캐릭터)로 유명했던 스캐터랩은 이번 제타를 통해 사용자가 직접 AI 캐릭터를 생성하고, 원하는 스토리를 전개할 수 있는 초개인화된 콘텐츠 창작 경험을 제공합니다. 특히, 제타는 로맨스부터 판타지, 학원물에 이르기까지 다양한 장르의 스토리를 구현할 수 있으며, 사용자 입력에 따라 행동 지시나 심리 묘사와 같은 지시문을 생성하여 웹소설 같은 스토리텔링을 가능하게 합니다. 이와 같은 플랫폼은 사용자가 AI와 함께 자신만의 취향을 담은 스토리를 창작하며 새로운 형태의 콘텐츠를 즐길 수 있는 기회를 제공함으로써, 창작의 경계를 확장하고 AI 기술의 잠재력을 새롭게 탐색하는 데 중요한 역할을 할 것으로 보입니다. <제타ai 바로가기>
😀
1
Vice_Versa
달리 3에서 인물 얼굴 변화없이 이미지 수정하기
*괜찮은 사례를 찾아서 여러분과 함께 공유합니다 :) 달리 3, 인페인팅 기능 추가 달리 3는 ChatGPT 유료 구독 시 이용 가능합니다. 지금까지는 수정을 요청하면 이미지를 처음부터 생성해주었지만, 인페인팅 기능이 추가되어 원하는 부분만 수정할 수 있게 되었습니다. 달리 3로 원하는 이미지를 생성하면 이미지 클릭 시 아래와 같이 이미지를 편집할 수 있는 창이 뜹니다. 상단의 브러쉬 모양의 아이콘을 클릭합니다. 마우스를 사용해 영역을 지정하고 오른쪽 대화창의 'Edit selection' 아래 지정한 영역을 어떻게 수정할 것인지 프롬프트를 입력합니다. 인물의 옷 부분을 선택하고 '분홍색 정장으로 바꿔줘'라는 프롬프트를 입력합니다. * 기존의 방식대로 영역 지정 없이 프롬프트를 입력하면 이미지를 처음부터 생성하기 때문에 인물의 포즈나 얼굴이 변화하게 됩니다. * 달리 3에서 이미지 생성 후 부분 수정만 하는 기능은 모바일(ChatGPT 앱)에서도 가능합니다. PC와 마찬가지로 이미지를 클릭한 뒤 브러쉬 모양 아이콘의 'Select'를 선택하여 영역을 지정할 수 있습니다. <원문 링크>
👍
1
Vice_Versa
GPT4로 사용자 경험 시나리오 확인하기, ‘ideator.design’
디자이너들을 위한 사용자 경험 시나리오 도구, ‘ideator.design’ 구글의 창작 보조 도구 ‘TextFX’ 실험에서 영감을 받은 'ideator.design' 서비스는 디자이너(사용자 경험)에 초점을 맞춰, 유사한 방식으로 내용을 입력하고 결과를 확인할 수 있습니다. GPT-4를 활용하여 (1) 인터랙션에 관한 아이디어 (2) 이러면 어떨까?(What if)로 활용할 수 있는 상황과 질문 (3) 사용자 흐름 (4) 사용자 관점 (5) 핵심 기능 (6) 사용자 시나리오 (7) 제약(특정 조건에서 설계해야 하는 경우) 등 사용자 경험 관련 일곱 가지 주요 항목을 효과적으로 정리할 수 있도록 돕습니다. 예시로 "모바일 앱 회원가입 시 사용자가 회원가입에 필요한 정보를 하나씩 입력하게 하는 방법" 같은 시나리오를 디자인하고 싶다면 방법에 대한 답변을 얻을 수 있습니다. 아래 원문 링크에서 자세한 사용 방법과 홈페이지에서 직접 테스트를 진행해 볼 수 있습니다. <홈페이지> <원문 링크>
👍
1