Share
Sign In

AI 트렌드 피드

최신 AI 트렌드와 관련 뉴스, AI의 활용 사례들을 공유합니다.
앤트로픽, 데이터 일괄 처리용 API 가격 50% 할인
앤트로픽, 오픈AI 대응해 데이터 일괄 처리용 API 가격 50% 할인 앤트로픽이 기업들이 방대한 데이터를 비용 효율적으로 처리할 수 있도록 새로운 '메시지 배치 API(Message Batches API)'를 출시했습니다. 이 API는 실시간 처리보다 가격이 50% 저렴하며, 긴급하지 않은 작업을 비동기식으로 처리할 수 있습니다. 이를 통해 빅데이터를 다루는 기업들이 고급 AI 모델을 더 저렴하게 활용할 수 있으며, 아마존 베드록과 구글 클라우드의 버텍스 AI를 통해 사용할 수 있습니다. 앤트로픽의 이번 움직임은 오픈AI의 리얼타임 API 출시에 대한 대응으로, AI 시장에서의 경쟁이 더욱 치열해지고 있음을 보여줍니다. 앤트로픽 '메시지 배치 API' 소개 페이지 :https://www.anthropic.com/news/message-batches-api 원문 출처 : https://www.aitimes.com/news/articleView.html?idxno=164088
  • V
    Vice_Versa
오픈AI, '챗GPT 캔버스' 출시
오픈AI, '챗GPT'의 글쓰기 및 코딩 프로젝트를 지원하는 새로운 인터페이스 '챗GPT 캔버스(ChatGPT Canvas)'를 출시 이 도구는 앤트로픽의 '아티팩트'와 유사하게, 사용자가 생성된 글이나 코드를 실시간으로 편집할 수 있는 기능을 제공합니다. 캔버스는 챗GPT 플러스와 팀즈 사용자들에게 베타 버전으로 제공되고 있으며, 추후 무료 사용자에게도 제공될 예정입니다. AI와의 협업을 통해 이메일 작성부터 복잡한 코딩 작업까지 폭넓은 활용이 가능합니다. 이번 출시는 AI 시장에서 오픈AI의 경쟁력을 강화하고, 챗GPT를 단순한 대화형 AI에서 실제 업무에 적합한 협업 도구로 발전시키기 위한 전략적 움직임으로 볼 수 있을 것 같습니다. 챗GPT 캔버스 공식 홈페이지 : https://openai.com/index/introducing-canvas/?utm_source=Viewsletter&utm_campaign=f432cf30a6-EMAIL_CAMPAIGN_2024_10_08_11_36&utm_medium=email&utm_term=0_-f432cf30a6-%5BLIST_EMAIL_ID%5D 원문 출처 : https://www.aitimes.com/news/articleView.html?idxno=163923
  • V
    Vice_Versa
😀
1
메타, AI 기반 동영상 생성 도구 '무비젠' 발표
Movie Gen은 기존 영상 수정, 개인화된 비디오 제작, 비디오 편집, 오디오 생성 등 네 가지 주요 기능을 제공 메타(Meta)가 텍스트 입력만으로 고해상도 동영상을 자동으로 생성하는 AI 기반 도구 '무비젠(Movie Gen)'을 발표했습니다. 무비젠은 최대 16초 길이의 동영상을 자동으로 생성하며, 기존 영상 수정, 개인화된 비디오 제작, 정밀한 비디오 편집, 오디오 생성 등 네 가지 주요 기능을 제공합니다. 사용자는 텍스트 명령을 통해 영상의 스타일을 바꾸거나 새로운 요소를 추가할 수 있으며, AI가 생성한 배경음악과 소리 효과까지 포함된 완성도 높은 콘텐츠 제작이 가능합니다. 메타는 무비젠이 오픈AI와 같은 경쟁사 도구보다 고품질의 짧은 영상을 특화해 제공한다고 강조했습니다. 현재 이 도구는 일반 사용자에게 공개되지 않았으며, 주로 엔터테인먼트 업계와 협력해 활용 방안을 모색 중입니다. 무비젠을 포함한 다양한 AI 영상 생성 도구 출시는 AI가 영상 제작 영역에서도 창작자들이 더욱 빠르고 창의적으로 콘텐츠를 제작할 수 있는 시대가 가까워졌음을 시사합니다. 출처 : https://www.aitimes.kr/news/articleView.html?idxno=32368 , 메타 공식 유튜브 채널
  • V
    Vice_Versa
👍
1
'미드저니, 최대 25개의 무료 이미지 제작 가능'
미드저니, 누구나 사용할 수 있는 웹 앱 버전 미드저니 공개 (현지시간 8월 22일 기준) 디스코드나 구글 계정으로 가입하면 최대 25개의 무료 이미지를 생성할 수 있는 새로운 이미지 생성 서비스가 제공됩니다. 가입 과정은 매우 간단하여 계정만 있으면 되고, 신용카드 정보는 전혀 필요하지 않습니다. 생성된 콘텐츠에는 다양한 저작권 라이선스가 부여되며, 자세한 내용은 이용약관을 참고하면 됩니다. 현재 웹 앱 버전은 베타 서비스로, 초기에는 디스코드 계정이 필요했던 점이 사라지면서 되었습니다. 개인적으로, 이러한 접근성 개선과 무료 이미지 제공은 미드저니가 신규 유저를 유입하려는 전략의 일환으로 보이며, 동영상 생성 프로그램 런칭에 대한 준비인 것으로 예상됩니다. 미드저니 웹 앱 버전 : https://www.midjourney.com/imagine <원본 링크>
  • V
    Vice_Versa
😀👍
2
글로벌 주요 3대 음반사, Suno AI, Udio AI를 상대로 소송 제기
글로벌 주요 3대 음반사(유니버설 뮤직 그룹, 워너 뮤직 그룹, 소니 뮤직 엔터테인먼트)가 AI 음악 회사 Suno AI와 Udio AI를 상대로 저작권 침해 소송을 제기 이들은 두 회사가 아티스트의 노래를 이용해 AI 서비스를 훈련시킴으로써 "저작권이 있는 음원에 대한 대량 침해"를 저질렀다고 주장하고 있습니다. 소송을 담당하고 있는 미국 음반 산업 협회(RIAA)는 보도자료를 통해 해당 서비스가 저작권이 있는 음반을 침해했다는 선언과 향후 같은 행위를 금지하는 가처분 명령, 이미 발생한 침해에 대한 손해배상을 요구하고 있습니다. 이는 엔터테인먼트와 AI 산업 간의 최근 대립을 보여주는 대표적인 사례로, 저작권 보호와 기술 혁신 사이의 균형을 찾는 것이 중요한 이슈로 떠오르고 있습니다. <원문 링크>
  • V
    Vice_Versa
👍
1
AI로 3일만에 만든 뮤직비디오
기획, 작사, 작곡, 영상편집, 커버작업까지 만 3일 만에 완료 FakeOven - 出勤無用曲(출근금지곡) 알파버전이 오픈된 'Runway Gen-3'로 노동의 슬픔을 담은 J-락 뮤비 AI의 강점을 잘 활용한 사례인 것 같아서 함께 공유하고자 합니다 :) <원문 링크>
  • V
    Vice_Versa
👍
1
이게 AI로 하룻 만에 만든 광고라고?
최근 볼보 광고, Runway의 최신 모델 'Gen-3 Alpha'를 사용해 제작 크리에이티브 자체는 평범하지만, 이 광고가 단 하루 만에 텍스트-비디오 플랫폼인 Runway의 최신 모델 'Gen-3 Alpha'를 사용해 제작되었다는 사실이 주목받고 있습니다. 이 광고는 컬러리스트 Laszlo Gaal이 개발했으며, 볼보의 자선 기금 'Volvo For Life'에서 영감을 받았습니다. Gaal은 AI로 설득력 있는 광고를 개발하기 위한 5가지 핵심 팁을 공유했습니다. <5가지 핵심 팁> 모델의 한계 파악 커뮤니케이션 뉘앙스 이해 환각(hallucination) 주의 후반 작업에서 불필요한 요소 제거 AI에 의존하지 말고 브랜드 제품 묘사 <원문 링크>
  • V
    Vice_Versa
👍
1
런웨이, 동영상 생성 AI 'Gen-3 Algha' 신규 모델 출시
런웨이, 오픈AI의 '소라'에 도전하는 새로운 비디오 생성 AI 'Gen-3 Alpha' 정식 출시 Gen-3 Alpha는 사용자당 월 12달러(약 1만6600원)부터 시작하는 유료 요금제로 제공되며, 텍스트뿐만 아니라 이미지와 비디오를 프롬프트로 사용해 90초 안에 고품질의 사실적인 장면을 생성할 수 있습니다. (현재는 Text-to-Video만 제공, 7/9 기준) Gen-3 Alpha는 Gen-2보다 생성 속도와 충실도가 대폭 향상되었고, 세밀한 구조, 스타일, 모션 제어가 가능합니다. 런웨이는 이 도구가 마케팅 및 광고 전문가를 포함한 콘텐츠 크리에이터에게 유용하며, 경쟁 제품보다 우수한 성능을 제공한다고 주장했습니다. 개인적으로, Gen-3 Alpha가 오픈AI의 소라에 대항마라고 불리기에는 결과물이 아직 부족한 감이 있습니다. (비교영상, 아래 X링크 참고) 그러나 소라가 언제 출시될지 모르는 상황에서, Gen-3 Alpha는 이미 출시되어 사용해볼 수 있다는 점에서 충분히 사람들의 관심을 끌었다고 생각됩니다. <원문 링크> https://academy.runwayml.com/gen3-alpha/getting-started-with-gen3-alpha
  • V
    Vice_Versa
👍
1
틱톡, AI 콘텐츠 제작 서비스 ‘TikTok Symphony’ 출시
틱톡, Gen AI 콘텐츠 제작 도구 ‘틱톡 심포니(TikTok Symphony)’를 출시. 틱톡은 6월 17일 생성 AI 기술 기반의 새로운 콘텐츠 제작 도구 ‘틱톡 심포니(TikTok Symphony)’를 출시했습니다. 심포니는 창작 과정 전반에 걸쳐 지원하며, 아이디어 브레인스토밍, 사례 구현, 사용자가 트렌드 분석, 아이디어 발굴 등을 통해 유기적 및 유료 콘텐츠의 질을 높일 수 있도록 돕습니다. 다양한 언어를 지원하며, 창작자들이 더 창의적이고 몰입감 있는 콘텐츠를 제작하는 데 기여할 것으로 기대됩니다. <TikTok Symphony 주요 기능 정리> Symphony Assistant 기능: 아이디어 브레인스토밍, 사례 구현, 트렌드 파악 등을 도와주는 가상 어시스턴트. 설명: 창작 과정 전반에 걸쳐 지원하며, 유기적 및 유료 콘텐츠의 질을 높이도록 도와줍니다. Symphony Creative Studio 기능: 최소한의 입력으로 짧은 시간 내에 매력적인 TikTok 비디오를 생성해주는 AI 도구. 설명: 제품 세부 정보를 제공하면 AI 엔진이 자동으로 다양한 TikTok 비디오 미리보기를 생성하며, 다국어 번역 및 음성 오버레이도 지원합니다. TikTok Ads Manager 기능: Symphony의 창의적 향상 기능을 통합하여 광고 제작 과정을 최적화하는 도구. 설명: 자동 진단 및 수정, 자동 최적화, 자동 생성 등의 기능을 통해 광고 성과를 높이고, 디스플레이 카드와 카루셀 이미지를 AI로 개선합니다. Symphony Digital Avatars
  • V
    Vice_Versa
😀
1
AI 디자인 시대, 정부에 제안하는 7가지 핵심 과제
AI의 급속한 발전은 디자인 산업에도 급격한 변화를 가져오고 있습니다. 이는 새로운 가능성을 보여주는 동시에 복잡한 법적, 윤리적 문제를 야기합니다. 디자이너들은 다양한 형태의 위기감을 느끼고 있는 것이 현실이며, 이 시점에서 정부의 역할은 그 어느 때보다 중요하다고 생각합니다. 이에 'AI 디자인 시대, 정부에 제안하는 7가지 핵심 과제'를 아래 정리해 봅니다. AI 디자인 윤리 가이드라인 마련 AI 기술이 발전하면서 윤리적 문제와 책임 문제가 지속적으로 대두되고 있습니다. AI 디자인 개발 및 활용 방법에 대한 윤리적 기준을 설정하고, 이를 준수하도록 유도하는 'AI 디자인 윤리 가이드라인' 수립이 시급합니다. 현재 정부 기관에서 몇 가지 가이드라인을 발행했지만, 실무에 바로 적용하기엔 부족함이 많습니다. 정부는 다양한 문제를 현명하게 해결할 수 있도록 투명성, 책임성, 공정성을 핵심으로 하는 보다 구체적인 윤리 가이드라인을 마련해야 합니다. 공정한 디자인 거래 환경 조성 AI 디자인은 이미 다양한 분야에서, 다양한 방법으로 활용되고 있습니다. 기술이 빠르게 발전하고 있는 만큼, AI 디자인은 막을 수 없는 흐름입니다. 이에 디자이너는 권리를 확실하게 보호 받고, 기업은 제대로 활용할 수 있는 공정한 거래 환경을 조성하는 것이 중요합니다. 정부는 이를 위한 법적, 제도적 장치를 마련하고 이를 지속적으로 모니터링한다면 안정적인 생태계 형성에 도움이 되리라 예상합니다. AI 디자인 연구 지원 AI 디자인 연구 지원을 확대해야 합니다. 실무에서 모든 AI 툴을 활용하고 스터디 하기엔 상당한 비용과 시간이 소요됩니다. 효율적인 활용 방법은 물론, 향후 AI 기반의 새로운 서비스, 제품 디자인을 제안할 수 있는 선행연구 지원이 절실합니다. AI 디자인은 기술과 창의성의 융합을 필요로 합니다. 디자이너와 AI 전문가 간의 협업을 장려하는 연구까지 지원한다면 보다 빠르게 미래 경쟁력을 확보할 수 있을 것입니다. 디자인 저작권법 강화 AI 기술을 활용한 디자인 창작물에 대한 저작권 귀속 문제와 보호 범위를 명확하게 마련하고, 디자인 저작권 침해 제재를 강화해야 합니다. 현재의 저작권법은 전통적인 창작물 보호에 치중되어 있어 AI로 생성된 디자인을 충분히 보호하지 못하고 있습니다. 저작권법을 개정하여 AI 디자인 창작물도 확실하게 보호받을 수 있도록 한다면, 이는 창작자의 권리를 보호하고 혁신을 장려하는 기반이 될 수 있을 것이며, 궁극적으로 디자인 산업의 지속 가능한 발전을 도모할 수 있을 것입니다. 디자이너 권리 보호 교육 강화 많은 디자이너들이 자신의 권리를 제대로 알지 못해 피해를 보는 경우가 많습니다. 정부는 체계적인 실무 중심의 권리 보호 교육 로그램을 통해 디자이너들이 법적 지식을 갖추고, 디자이너 스스로 자신의 권리를 인지하고 적극적으로 보호할 수 있도록 지원해야 합니다. 매년 디자이너를 대상으로 한 법적 권리 보호 워크숍을 개최하고 온라인 교육 플랫폼을 통해 접근성을 높인다면, 분명 피해를 최소화하는데 큰 도움이 될 것입니다. 디자인 분쟁 조정 기구 설립 누구나 AI를 활용하여 디자인 할 수 있는 시대이니 만큼, 디자인 관련 분쟁 또한 늘어날 것으로 예상합니다. AI 디자인 분야에서 발생하는 분쟁은 복잡하고 전문적인 지식을 요구하는 동시에, 산업의 특성상 빠르게 해결하지 못하면 사실상 무의미합니다. 이를 전문적으로 다룰 수 있는 'AI 디자인 분쟁조정위원회'와 같은 기구를 신설하여 신속하고 전문적인 분쟁 해결을 지원한다면, 신속하고 효율적인 분쟁 해결이 가능해질 것입니다.
  • V
    Vice_Versa
👍
1
동영상 생성 인공지능(AI) ‘클링(Kling)’ 등장
중국의 콰이쇼우가 개발한 동영상 생성 인공지능 '클링(Kling)' AI 서비스는 오픈AI의 '소라'와 비교되며, 일반 사용자에게 공개된 점이 특징입니다. 클링은 최대 2분 길이의 고해상도 동영상을 생성할 수 있으며, 물리적 상호 작용을 정확하게 시뮬레이션하는 능력을 지녔다고 평가받고 있습니다. 또한, 이미 테스트 단계에서 사용자들은 클링의 영상이 소라보다 우수하다고 평가하였습니다. 현재 클링은 중국 내에서만 데모 영상을 제공하고 있으며, 미국인들은 클링의 공식 출시를 기다리면서 등록 방법에 대해 논의 중입니다. 클링의 출시는 기존의 동영상 생성 AI 시장에 새로운 경쟁을 불러일으킬 것으로 예상됩니다. <원문 링크>
  • V
    Vice_Versa
👍
1
텍스트만으로 효과음 생성하기 (Text to Sound Effects)
일레븐랩스, 텍스트 기반 음향 효과 생성 AI ‘사운드 이펙트’ 출시 음성 인공지능(AI) 선두 스타트업 일레븐랩스가 텍스트 설명으로 음향 효과를 생성하는 혁신적인 도구 ‘사운드 이펙트(Sound Effects)’를 공개했습니다. 이 도구는 사용자의 프롬프트를 통해 최대 22초 길이의 사운드를 생성하며, 무료 및 유료 사용자 모두에게 다양한 옵션을 제공합니다. 특히 영화, 게임, 팟캐스트 제작자들이 빠르고 저렴하게 몰입감 넘치는 음향 효과를 대규모로 생성할 수 있도록 설계되었습니다. 일레븐랩스 외에도 스태빌리티 AI(스테이블 오디오)와 메타(오디오크래프트)가 AI 음향 생성 시장에 진출하면서 경쟁이 치열해지고 있습니다. 개인적인 의견으로, 이러한 AI 도구들은 창작자들에게 시간과 비용을 절약할 수 있는 강력한 도구가 될 것 같습니다. 테스트는 아래 링크에서 가능합니다. <원본 링크>
  • V
    Vice_Versa
😀
1
브랜드 기획부터 디자인까지, 생성형 AI 300% 활용 실무 가이드
안녕하세요~ 바이스 버사 디자인 스튜디오 김묘영 대표님의 강의가 콜로소에 오픈되었습니다. AI를 쓰긴 써야 할 것 같은데 아직 시작하지 못하신 분들, 몇 번 써보다가 포기하신 분들, 이미 쓰고 있지만 실무에 보다 유용하게 사용하고 싶으신 분들을 위한 강의입니다. 많은 관심 부탁드립니다 :)
  • V
    Vice_Versa
👍
1
구글, 프롬프트 비결 담은 가이드북 발간
"최적의 프롬프트 단어 수는 21개" 자연어를 사용, 마치 사람에게 말하는 것처럼 하라 구체적이고 반복적으로 메시지를 전달하라 문장 하나에 여러 문장을 포함하지 말고, 최대한 간결하게 하라(전문 용어는 가급적 피하기) 세부 내용을 조금씩 조정하며 결과를 개선하라 구글이 개발자 회의(I/O)에서 45페이지 분량의 '제미나이 프롬프트 가이드'를 공개하며 프롬프트 작성의 중요성과 기술을 강조했습니다. 특히, 연구를 통해 가장 효과적인 프롬프트는 평균 21단어에서 나타났다고 소개하며, 일반적으로 사람들이 사용하는 단어는 9단어 미만의 짧은 프롬프트라고 지적했습니다. 또한, 구글 독스나 지메일에서의 프롬프트 작성에 필요한 '페르소나', '작업', '문맥', '형식' 등 네 가지 핵심 요소를 포함해야 함을 설명하고, 자연어 사용, 구체성 강조, 간결함 유지 등을 조언하면서, 효과적이지 않은 프롬프트에 대해서는 세부사항을 조정해가며 결과를 개선할 것을 권장했습니다. 이 가이드는 고객 서비스, 대기업 임원, 인사, 마케팅, 프로젝트 관리, 영업 등 다양한 분야에 적용 가능한 프롬프트 작성법을 제공하여 실용적인 도움을 제공할 수 있을 것으로 보입니다. 해당 가이드북은 클릭 시 온라인에서 다운받을 수 있습니다. <원문 링크>
  • V
    Vice_Versa
😀
1
Gen AI 인재 : 인력 유출 위험과 인력 변화 전략
*본 글은 맥킨지 "Gen AI talent: Your next flight risk"의 팟캐스트 내용을 요약한 글입니다. Gen AI시대의 AI 인력의 이직 위험, 인력 유치, 업무 재정의, 리더십 전략 등 전체적인 내용을 포괄적으로 서술 1. AI Talent is Primed to Quit Gen AI 기술에 능숙한 직원들은 이직 위험이 높습니다. 이들은 기업이 내부 인재를 재교육하고 업스킬하는 데 중요한 역할을 하지만, 높은 수요와 이직 가능성으로 인해 유출 위험이 큽니다. Gen AI 인재는 기술적 작업뿐만 아니라 비기술적 업무에서 효율성을 높이기 위해 AI를 사용하는 직원들도 포함됩니다. 2. The Risks of Not Listening Gen AI 인재의 절반 이상이 이직 위험에 처해 있으며, 이는 기업에 큰 손실을 초래할 수 있습니다. 이들은 보상보다 유연성, 의미 있는 일, 지원적인 동료, 건강 및 웰빙을 중시합니다. AI가 루틴 작업을 처리하면서 남는 일은 더 인간적인 작업이므로, 직원들은 인간으로 대우받기를 원합니다. 기업은 직원들이 필요로 하는 환경을 제공해야 합니다. 3. Recruiting Gen AI Talent Gen AI 인재를 채용하려면 돌보는 리더, 의미 있는 일, 유연한 근무 환경, 포용성과 공동체 의식을 제공해야 합니다. 유연성은 기본 요건이 되었으며, 직원들이 느끼는 지지와 연결감이 더 중요합니다. 4. Redefining Work AI가 많은 루틴 작업을 처리하게 되면서 '열심히 일한다'는 정의가 바뀌고 있습니다. 성과 관리는 생산성의 질과 영향에 중점을 두어야 하며, 전통적인 생산성 측정 방법은 더 이상 유효하지 않습니다. 조직의 계층 구조는 AI가 루틴 작업을 대신하면서 바뀔 수 있습니다. 5. Immediate Steps Leadership Can Take 리더는 건강한 작업 환경을 조성하고, 생산성과 지속 가능한 작업 관행을 강조해야 합니다. 모든 직원을 잠재적 리더로 간주하고, 협력적이고 지지적인 공동체를 형성하는 것이 중요합니다. 또한, 기업은 직원들이 gen AI를 효과적으로 사용할 수 있도록 재교육하고, 시간 절약을 생산적으로 활용할 수 있도록 변화 관리 계획을 세워야 합니다. 6. Gen AI is Not the Enemy 많은 직원들이 Gen AI를 긍정적으로 받아들이고 있습니다. AI가 단순 작업을 처리함으로써 더 가치 있는 일에 집중할 수 있게 되어, 오히려 직업 만족도가 높아졌습니다. 조직은 AI 도입으로 인한 변화에 대해 체계적으로 접근해야 합니다. 7. The CEO’s Distinctive Storytelling Capability CEO는 회사의 이야기를 효과적으로 전달하여 직원들의 동기부여와 전략적 방향성을 제시해야 합니다. 강력한 이야기와 일관된 메시지는 조직의 목적을 명확히 하고, 직원들이 자신의 역할을 이해하고 가치 있게 느끼도록 돕습니다. CEO는 다양한 이해관계자에게 맞춤형 커뮤니케이션을 제공해야 합니다.
  • V
    Vice_Versa
😀
1
OpenAI의 새로운 모델, GPT-4o 발표
오픈AI는 최신 AI 모델 GPT-4o를 공개 GPT-4o는 음성, 텍스트, 이미지 인식 기능이 통합된 멀티모달 모델로, GPT-4 터보보다 2배 빠른 API를 제공하며, 50개 언어를 지원하고 텍스트 및 이미지 기능을 무료로 사용할 수 있습니다. GPT-4o는 기존 GPT-4처럼 주고받을 수 있는 메시지 갯수에 한도가 존재합니다. 특히, 사람의 감정과 얼굴 표정 인식이 가능하며, 실시간 대화와 통역 기능을 통해 자연스러운 상호작용을 제공합니다. 이 모델은 AI의 인간화와 실생활 응용에 혁신적인 변화를 가져올 것으로 기대됩니다. <원문 링크>
  • V
    Vice_Versa
👍
1
iOS용 클로드 앱 출시, 무료로 오픈
안드로이드 버전도 곧 선보일 예정, 악의적 사용은 엄중히 제재 할 것 앤트로픽은 iOS용 클로드3 기반 앱을 출시하며, 이를 모든 사용자에게 무료로 제공한다고 발표했습니다. 이 모바일 앱은 대화, 이미지 분석, 데이터 시각화 등 다양한 기능을 제공하며, 웹과의 연동도 지원하여 업무의 연속성을 보장합니다. 또한, 안드로이드 버전의 출시가 임박했으며, 악의적 사용에 대해서는 엄중한 제재를 예고했습니다. 기업 사용자를 위해 '팀 플랜'이라는 유료 서비스도 도입되어, 다수의 사용자가 협업을 통해 업무 효율성을 높일 수 있도록 설계되었습니다. 이 플랜은 오퍼스, 소넷, 하이쿠 등 다양한 클로드3 모델을 포함하여, 복잡한 업무 요구 사항을 충족시키기 위한 맞춤형 AI 도구로 구성되어 있습니다. 모바일 앱을 통해 클로드는 AI 기술의 대중화와 접근성 증진에 큰 역할을 할 것으로 보이며, 다양한 기능 등을 통해 사용자가 여러 컨텍스트에서 AI를 활용할 수 있게 도와줄 수 있을 것 같습니다. <원문 링크>
  • V
    Vice_Versa
👍😀
2
빅테크 기업, AI 학습 데이터 수집을 위한 ‘골드러시’
사진 1~2달러, 영상 2~4달러, 문서는 1000자에 1달러 거래 생성형 인공지능(AI) 개발에 있어 데이터 수집이 핵심 요소로 부상하고 있습니다. 빅테크 기업들은 AI 학습을 위해 사진, 영상, 문서 등 다양한 데이터를 대량으로 구입하며 '데이터 골드러시'를 경험하고 있습니다. 특히, 사진은 1~2달러, 영상은 2~4달러, 문서는 1000자에 1달러의 가격으로 거래되고 있습니다. 이러한 데이터 수집은 저작권 문제로 인해 무료 데이터의 사용이 제한됨에 따라 더욱 확대되고 있습니다. 오픈AI는 100만 시간의 유튜브 영상을 통해 텍스트를 수집하여 GPT-4의 학습에 활용했으며, 이런 추세는 AI 모델의 성능 향상에 결정적인 영향을 미칩니다. 또한, AI가 생성한 데이터를 활용하여 저작권 문제를 해결하고자 하는 노력도 이루어지고 있어, 이 분야의 혁신은 계속될 것으로 보입니다. 이처럼 데이터의 중요성이 강조되는 시대에서, 데이터의 윤리적 수집과 활용에 대한 철저한 규제와 가이드라인 마련이 절실히 요구된다고 생각합니다. <원문 링크>
  • V
    Vice_Versa
😘👍
2
오픈AI, 챗GPT 플러스에 ‘메모리’ 기능 추가
대화 내용을 기억할 수 있는 '메모리' 기능 추가 발표, 하지만 유럽과 한국은 제외 이 메모리 기능은 사용자의 반복적인 정보를 저장하고, 이를 기반으로 사용자가 추가적인 설명 없이도 적절한 답변을 받을 수 있게 해주며, 맞춤형 이미지 생성도 가능하게 합니다. 하지만 이 기능은 모든 챗GPT 플러스 가입자들에 제공되지만, 유럽과 한국에서는 사용할 수 없습니다. 오픈AI는 이 기능을 올해 초에 테스트했으며, 사용자 입력을 통한 메모리 업데이트 기능을 포함하는 등 여러 개선점을 도입한 정식 버전을 공개했습니다. 이 메모리 기능은 향후 챗GPT 플러스의 모든 구독자뿐만 아니라 팀, 엔터프라이즈, GPTs에도 적용될 예정이지만, 구체적인 일정은 아직 공개되지 않았습니다. <원문 링크>
  • V
    Vice_Versa
😀
1
SORA 단편 영화 "Air Head" 제작 사례
SORA 단편 영화 Air Head, 에미상과 오스카상 후보에 지명 최근 캐나다의 제작 회사 Shy Kids는 SORA를 사용하여 단편영화 'Air Head'를 제작했는데, 이는 '펑크 록 픽사'로 불리우며 에미상 후보에 오르고 오스카상에도 후보 리스트에 올랐습니다. SORA는 한 번에 최대 1분 길이의 비디오를 생성할 수 있습니다. 특히 다수의 프레임을 예측하여 일시적으로 화면에서 사라진 주제가 일관성을 유지하도록 하는 문제를 해결했다고 전했습니다. SORA는 현재 개발 중이며, 사용자 인터페이스를 통해 텍스트 프롬프트 입력 후 클립 생성을 시작할 수 있습니다. 그러나 아직 완전한 모달성은 갖추지 못했고, 동일한 프롬프트를 반복 실행해도 다른 결과가 나올 수 있어 계속 영상 제작사와의 협업을 통해 개선중에 있습니다. 아래에 단편 영화(1분2 0초) 링크도 함께 놓았으니 관람해보시길 바랍니다. <원문 링크>
  • V
    Vice_Versa
👍
1
어도비 프리미어에 비디오 생성 인공지능(AI) 툴 결합 예정
'어도비 프리미어 프로'에 비디오 생성 인공지능(AI) 'OpenAI, Pika, Runway' 등 도구들 통합 예정 이번 업데이트를 통해 사용자들은 실사 영상과 AI 생성 영상을 혼합하거나, 실제 촬영하지 않은 장면을 생성하여 영상 속에 삽입하는 등 다양하고 복잡한 편집 작업을 수행할 수 있게 됩니다. 예를 들어, AI를 활용하여 괴물을 생성하고 배경을 교체해 추격전 장면을 완성하는 것이 가능해집니다. 이러한 기능은 특히 영화 제작자들에게 큰 호응을 얻고 있으며, 전문 컴퓨터 그래픽 작업을 대체할 수 있는 새로운 가능성을 열어주고 있습니다. 어도비는 이와 함께 '콘텐츠 자격 증명(Content Credentials)'을 통해 생성된 콘텐츠가 어떤 AI 모델을 사용했는지를 명시할 계획이라고 밝혔습니다. <원문 출처>
  • V
    Vice_Versa
😀
1
핑크 플로이드 팬 비디오 대회서 생성 AI 작품 수상 논란
핑크 플로이드의 50주년 기념 앨범 '다크 사이드 오브 더 문'의 뮤직비디오 공모전, 인공지능(AI)이 생성한 비디오가 수상작으로 선정 역대 가장 인기 있는 록 밴드 중 하나인 핑크 플로이드가 50주년 기념 앨범의 뮤직비디오 공모전에서 인공지능(AI)이 생성한 비디오를 수상작으로 선정, 논란이 일고 있습니다. 독립 CGI 아티스트 데미안 가우메는 AI '스테이블 디퓨전'을 사용하여 '애니 컬러 유 라이크'의 비디오를 제작, 상금을 획득했습니다. 이 작품은 우주 공간을 배경으로 한 몽환적인 장면과 악기의 클로즈업으로 구성되었습니다. 그러나 이 수상 결정은 다른 참가자들과 팬들 사이에서 강한 반발을 일으켰으며, 수작업으로 창작된 작품들을 무시하는 것이라는 비판이 제기되었습니다. 이러한 사례는 AI의 창작 예술 분야 활용에 대한 논란을 더욱 가열시키며, 앞으로의 예술계 변화에 중대한 도전을 제시하고 있습니다. <원문 링크>
  • V
    Vice_Versa
👍
1
구글, '생성 AI 사진 편집' 기능 무료로 확대
구글, 픽셀 폰이나 갤럭시 S24 등에서 인기를 얻은 인공지능(AI) 사진 편집 기능 무료로 공개 구글이 자사의 인공지능(AI) 사진 편집 기능을 무료로 확대 공개했습니다. 이 기능은 구글 포토 앱을 통해 이용할 수 있으며, 특정 스마트폰 사양을 충족하는 사용자라면 누구나 접근 가능합니다. 구글은 이전에 픽셀 폰 사용자와 유료 클라우드 서비스 구독자에게만 제공했던 매직 에디터, 매직 이레이저, 포토 언블러, 인물 사진 조명 등의 다양한 AI 편집 도구를 이제는 더 많은 기기 사용자에게 제공하기로 결정했습니다. 시장에 AI 기반 편집 도구가 넘쳐나면서 구글은 이들을 무료로 제공하는 전략을 채택했습니다. 이 업데이트는 5월 15일부터 순차적으로 이루어질 예정입니다. <원본 링크>
  • V
    Vice_Versa
😀👍
2
AI 스토리 창작 플랫폼 ‘제타’에서 유명 캐릭터와 대화하기
스캐터랩, 사용자 맞춤형 AI 스토리 창작 플랫폼 ‘제타’ 출시 한때 이루다(AI캐릭터)로 유명했던 스캐터랩은 이번 제타를 통해 사용자가 직접 AI 캐릭터를 생성하고, 원하는 스토리를 전개할 수 있는 초개인화된 콘텐츠 창작 경험을 제공합니다. 특히, 제타는 로맨스부터 판타지, 학원물에 이르기까지 다양한 장르의 스토리를 구현할 수 있으며, 사용자 입력에 따라 행동 지시나 심리 묘사와 같은 지시문을 생성하여 웹소설 같은 스토리텔링을 가능하게 합니다. 이와 같은 플랫폼은 사용자가 AI와 함께 자신만의 취향을 담은 스토리를 창작하며 새로운 형태의 콘텐츠를 즐길 수 있는 기회를 제공함으로써, 창작의 경계를 확장하고 AI 기술의 잠재력을 새롭게 탐색하는 데 중요한 역할을 할 것으로 보입니다. <제타ai 바로가기>
  • V
    Vice_Versa
2
😀
1
달리 3에서 인물 얼굴 변화없이 이미지 수정하기
*괜찮은 사례를 찾아서 여러분과 함께 공유합니다 :) 달리 3, 인페인팅 기능 추가 달리 3는 ChatGPT 유료 구독 시 이용 가능합니다. 지금까지는 수정을 요청하면 이미지를 처음부터 생성해주었지만, 인페인팅 기능이 추가되어 원하는 부분만 수정할 수 있게 되었습니다. 달리 3로 원하는 이미지를 생성하면 이미지 클릭 시 아래와 같이 이미지를 편집할 수 있는 창이 뜹니다. 상단의 브러쉬 모양의 아이콘을 클릭합니다. 마우스를 사용해 영역을 지정하고 오른쪽 대화창의 'Edit selection' 아래 지정한 영역을 어떻게 수정할 것인지 프롬프트를 입력합니다. 인물의 옷 부분을 선택하고 '분홍색 정장으로 바꿔줘'라는 프롬프트를 입력합니다. * 기존의 방식대로 영역 지정 없이 프롬프트를 입력하면 이미지를 처음부터 생성하기 때문에 인물의 포즈나 얼굴이 변화하게 됩니다. * 달리 3에서 이미지 생성 후 부분 수정만 하는 기능은 모바일(ChatGPT 앱)에서도 가능합니다. PC와 마찬가지로 이미지를 클릭한 뒤 브러쉬 모양 아이콘의 'Select'를 선택하여 영역을 지정할 수 있습니다. <원문 링크>
  • V
    Vice_Versa
👍
1
GPT4로 사용자 경험 시나리오 확인하기, ‘ideator.design’
디자이너들을 위한 사용자 경험 시나리오 도구, ‘ideator.design’ 구글의 창작 보조 도구 ‘TextFX’ 실험에서 영감을 받은 'ideator.design' 서비스는 디자이너(사용자 경험)에 초점을 맞춰, 유사한 방식으로 내용을 입력하고 결과를 확인할 수 있습니다. GPT-4를 활용하여 (1) 인터랙션에 관한 아이디어 (2) 이러면 어떨까?(What if)로 활용할 수 있는 상황과 질문 (3) 사용자 흐름 (4) 사용자 관점 (5) 핵심 기능 (6) 사용자 시나리오 (7) 제약(특정 조건에서 설계해야 하는 경우) 등 사용자 경험 관련 일곱 가지 주요 항목을 효과적으로 정리할 수 있도록 돕습니다. 예시로 "모바일 앱 회원가입 시 사용자가 회원가입에 필요한 정보를 하나씩 입력하게 하는 방법" 같은 시나리오를 디자인하고 싶다면 방법에 대한 답변을 얻을 수 있습니다. 아래 원문 링크에서 자세한 사용 방법과 홈페이지에서 직접 테스트를 진행해 볼 수 있습니다. <홈페이지> <원문 링크>
  • V
    Vice_Versa
👍
1
애플, 일부 GPT-4·제미나이 능가하는 '이미지-텍스트' 모델 공개
애플, 300억 매개변수를 가진 최신 이미지-텍스트 멀티모달 모델 'MM1'을 공개 애플이 공개한 최고 성능의 이미지-텍스트 멀티모달 모델은 300억 매개변수를 자랑하며, 이미지를 읽고 자연어로 설명하는 능력에서 기존의 오픈AI 'GPT-4' 및 구글 '제미나이 울트라'와 같은 경쟁 모델을 일부 분야에서 추월했다고 합니다. 이 대형 멀티모달 모델은 이미지 생성 능력은 없지만, 이미지 인코더와 비전-언어 커넥터를 활용해 다양한 사전 훈련 데이터를 통해 고성능을 달성하기 위한 방법과 통찰을 제공합니다. 연구진은 이미지 해상도와 토큰 수를 중요한 요소로 보면서, 이미지와 텍스트 데이터의 혼합을 통한 벤치마크 최고 성능 달성의 중요성을 강조했습니다. MM1 모델은 이미지 인식, 읽기, 기본 계산 등 복잡한 문제 해결에 뛰어난 성능을 보여, 현 최고 수준의 AI 기술을 한 단계 더 발전시키는데 기여했습니다. 애플은 이러한 성과를 바탕으로 AI 연구 및 개발에 본격적으로 나서, 온디바이스 AI 구축을 위한 전용 칩과 최적화된 기술을 개발하고, 최근에는 10억 달러를 투자해 제품 라인업 전반에 생성 AI를 도입하려는 계획을 밝혔습니다. <원문 링크>
  • V
    Vice_Versa
👍
1
구글, 얼굴 사진 움직이는 AI '브이로거(VLOGGER)' 공개
브이로거(VLOGGER), 단일 스틸 사진으로부터 말하고 움직이는 모습을 실감나게 재현할 수 있는 AI 기술 시스템 브이로거는 음성 데이터에 맞춰 입 모양, 표정, 머리 움직임, 손짓을 포함한 다양한 인간의 행동을 자연스럽게 생성할 수 있는 능력을 가지고 있습니다. '멘터(MENTOR)'라는 대규모 데이터셋을 통해 학습된 이 기술은 다양한 인종, 연령, 의상, 포즈 및 배경을 가진 인물의 비디오를 생산할 수 있으며, 프리젠테이션, 교육, 나레이션 등 여러 분야에서 활용될 가능성을 지니고 있습니다. 비록 현재로서는 아직 2D 환경에서만 작동하고, 실제 인간의 말투나 버릇을 완벽히 구현하기에는 한계가 있지만, 브이로거는 현존하는 이미지-영상 변환 기술보다 뛰어난 이미지 품질, 신원 보존, 시간적 일관성을 제공함으로써 인간과 컴퓨터 간의 상호작용을 한층 발전시킬 것으로 기대됩니다. <발췌 논문> <원문 링크>
  • V
    Vice_Versa
😀
1
피규어 01: 오픈AI와의 협력으로 탄생한 휴머노이드 로봇
오픈AI와 휴머노이드 로봇 스타트업 피규어의 협력으로 탄생한 '피규어 01' 공개 이 로봇은 사람의 질문을 이해하고 정확히 대답할 뿐만 아니라, 시각적 인식을 통해 주변 환경과 상호작용할 수 있는 능력을 보여주었습니다. 예를 들어, 로봇은 사과를 인식하고, 인간에게 건네주며, 쓰레기를 줍는 등의 행동을 선보였습니다. 전세계 네티즌들은 이 기술의 발전 속도와 가능성에 대해 "충격적이다"와 같은 반응을 보이며, 일부는 '터미네이터'와 같은 SF 영화가 현실로 다가오고 있다고 평가했습니다. 피규어 01의 이러한 성능은 오픈AI의 언어 이해 및 시각적 추론 능력과 피규어의 신경망을 통한 민첩한 동작 덕분이었습니다. 이 혁신적인 발전은 AI와 로봇공학이 어떻게 일상 생활에 깊숙이 통합될 수 있는지를 보여줍니다. 사람들이 이 기술의 발전에 충격을 받는 것은 이해할 수 있지만, 이러한 발전이 가져올 긍정적인 변화와 가능성에 주목해야 한다고 생각합니다. 예를 들어, 이 기술은 홈케어, 의료, 재난 구조 등 다양한 분야에서 혁신적인 솔루션을 제공할 잠재력을 가지고 있습니다. 그러나 이와 동시에, 이러한 발전이 인간의 일자리, 사생활 보호, 윤리적 문제 등에 미칠 영향에 대해서도 신중한 고민과 대책이 필요하다는 점을 강조하고 싶습니다. <원문 링크>
  • V
    Vice_Versa
😀
1
MS의 코파일럿에 GPT-4 터보 무료 제공, GPT-4.5 출시 임박?
마이크로소프트(MS)가 오픈AI의 ‘GPT-4 터보’를 코파일럿 무료 버전에도 제공 마이크로소프트가 오픈AI의 GPT-4 터보를 코파일럿의 무료 버전에 제공하기로 결정했습니다. 이에 따라 GPT-4.5 모델 출시가 임박한 상황으로 예측되고 있습니다. 코파일럿 프로 구독자는 최신 모델인 GPT-4 터보와 코파일럿 GPT 빌더를 사용할 수 있습니다. MS는 코파일럿 유료 모델을 확대하고자 코파일럿 프로 1개월 무료 평가판을 출시할 예정이며, 몇 달 내에는 모바일에도 무료 평가판을 적용할 예정이라고 밝혔습니다. 코파일럿 프로에는 곧 GPT-4 터보보다 강력한 모델이 탑재될 것으로 예상되며, GPT-4.5 출시에 대한 기대와 소문이 확산되고 있습니다. <원문 링크>
  • V
    Vice_Versa
👍
1
이제 AI로 한글 폰트 찾으세요
산돌메타랩, GPT 스토어에 최초의 한글 폰트 검색 서비스 '코리안 폰트 파인더(Korean font finder)'를 출시 Korean font finder'는 사용자가 이미지를 업로드하면 산돌메타랩의 AI 기술을 활용하여 해당 폰트의 이름과 제작사를 신속하게 확인할 수 있습니다. 이미지 속 한글을 인식하여 사용자가 필요한 한글 폰트를 검색하는 데 도움을 줍니다. 이 서비스는 산돌메타랩의 머신러닝 기술과 알고리즘을 기반으로 하며, 한글 폰트의 스타일, 디자인 요소, 활용 분야 등을 고려하여 최적화된 폰트 추천을 제공합니다. 이를 통해 사용자는 업무 시간을 절약하고 업무 효율을 높일 수 있습니다. 또한, 산돌메타랩은 앞으로 다양한 언어에 대한 폰트 서비스를 확장할 계획입니다. <원문 링크>
  • V
    Vice_Versa
😀
1
ChatGPT를 더 잘 쓰는 26가지 마법의 프롬프트
ChatGPT에서 프롬프트를 간소화 하면서도 정확하고 구체적인 답변을 받기 위한 연구를 진행. 연구 결과, 26가지 프롬프트 원칙을 도출 및 제안. 챗GPT를 사용하면서 어떻게 질문해야 할지 모를 때 참고하기 좋은 글을 가져왔습니다. 기존에 사용하던 방식들도 있고 새로 알게 된 방법들도 있어서 흥미로웠습니다 :) 이 글은 Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 (Sondos Mahmoud Bsharat, Aidar Myrzakhan, Zhiqiang Shen)논문에서 발췌한 내용입니다. <발췌 논문> Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 (Sondos Mahmoud Bsharat, Aidar Myrzakhan, Zhiqiang Shen) <원문 링크>
  • V
    Vice_Versa
👍😀
2
Stability AI, 비디오 생성형 AI 툴 ‘스테이블 비디오’ 런칭
Stability AI, 비디오 생성 서비스인 ‘스테이블 비디오’ 런칭 2월 24일(토)에 런칭된 Stability AI의 비디오 생성 서비스인 스테이블 비디오는 사용자가 텍스트 명령어나 이미지를 영상으로 변환할 수 있습니다. 현재는 4초 길이의 영상을 생성할 수 있으며, 사용자는 매일 150개의 크레딧을 무료로 받을 수 있습니다. OpenAI의 Sora가 공개된 이후 AI 영상에 대한 유저들의 기대감이 매우 높아진 상황을 알기 때문에 Stability AI 창립자는 본인의 X에서 OpenAI의 Sora와 같은 모델을 만들기 위해 더 많은 데이터가 필요하다고 언급했습니다. 영상의 퀄리티를 보면 Sora에 비해 다소 아쉽지만 현재로서는 무료로 사용할 수 있는 비디오 생성 툴이며 비교적 간단하고 쉬운 방식으로 영상을 제작할 수 있기 때문에 테스트해 보시는 것을 추천드립니다. 아래 링크를 통해 테스트 할 수 있습니다.
  • V
    Vice_Versa
😀
1
Stability AI, 스테이블 디퓨전 3 모델 공개
스테이블 디퓨전 3, 문장형 프롬프트 지원 및 텍스트 렌더링 기능 추가 Stability AI가 2/22(화) 공식 홈페이지를 통해 스테이블 디퓨전 3 모델을 공개했습니다. 현재는 Waitlist 등록 후 사용 권한을 받아 이용할 수 있습니다. 이 모델은 이전 모델에 비해 프롬프트 이해 및 텍스트 렌더링 능력이 향상되었습니다. 사용자가 문장 형태의 프롬프트를 사용할 수 있으며, 텍스트를 이미지로 변환하는 기능(=텍스트 렌더링)도 추가되었습니다. 또한 이미지 퀄리티도 향상되어 실제 사진과 유사한 이미지를 생성할 수 있게 되었습니다. Stability AI의 창립자인 Emad Mostaque가 자신의 X에서 관련 정보를 공개 중이며, 최신 정보는 그의 X에서 확인할 수 있습니다. https://twitter.com/EMostaque <원문 링크>
  • V
    Vice_Versa
👍
1
구글, 최첨단 오픈 모델 ‘젬마(Gemma)’ 공개
구글, AI를 이용하는 개발자와 연구진들을 지원하기 위해 새로운 오픈 모델 젬마 공개 젬마는 오늘(24.2.21)부터 전 세계에서 이용가능하며, 주요 특징은 다음과 같습니다. 다양한 규모로 제공되는 최신 성능 - 이번에 공개되는 모델은 젬마 2B와 젬마 7B 두 가지로 제공. - 두 유형 모두 각각 사전 훈련(pre-trained), 지시 조정(instruction-tuned), 변형(variants)과 함께 제공. 구글의 AI 원칙을 최우선으로 설계 - 책임감 있는 생성형 AI 툴킷 제공 - 안전성 분류 기준 제공 - 디버깅 지원 - 가이던스 제공 프레임워크, 툴, 하드웨어 전반에 최적화 - JAX, PyTorch, TensorFlow와 같은 주요 프레임워크에서 추론 및 지도 학습을 위한 툴체인 제공 - 멀티 프레임워크 툴 통합 제공 - 구글 클라우드에 최적화 연구 및 개발을 위한 무료 크레딧 제공 - 캐글(Kaggle)내 무료 이용권 - 코랩(Colab) 노트북의 무료 티어 - 구글 클라우드 첫 이용자를 위한 미화 300달러 상당의 크레딧을 이용해 젬마를 활용 가능 - 연구진은 최대 미화 50만 달러 상당의 구글 클라우드 크레딧 신청 가능 아래 버튼으로 '젬마' 시작 가능 <원문 링크>
  • V
    Vice_Versa
👍
1
Made with SlashPage