Meta, 텍스트를 소리로 바꿔주는 AudioBox 공개
Haebom
Audiobox는 Meta가 새롭게 선보인 오디오 생성을 위한 연구 기반 모델입니다. 이 모델은 음성 입력과 자연어 텍스트 프롬프트의 조합을 사용하여 목소리와 사운드 이펙트를 생성할 수 있으며, 다양한 용도로 맞춤형 오디오를 쉽게 생성할 수 있게 해줍니다. Audiobox는 자연어 프롬프트를 사용하여 생성하고자 하는 사운드 또는 음성 유형을 설명하게 하며, 사용자는 음성 입력과 텍스트 스타일 프롬프트를 결합하여 어떤 환경(예: "대성당 안에서")이나 감정(예: "슬프고 느리게 말한다")에서도 그 목소리로 음성을 합성할 수 있습니다. Audiobox는 자유 형식의 음성 스타일 변경을 위해 음성 프롬프트와 텍스트 설명 프롬프트의 이중 입력을 가능하게 하는 최초의 모델로 알려져 있습니다.
논문 요약
주요 기능
다양한 음성 및 비음성 사운드 이펙트와 사운드스케이프 생성
자연어 프롬프트를 사용하여 원하는 사운드 또는 음성 유형 설명
오디오 음성 입력과 텍스트 스타일 프롬프트의 결합을 통한 맞춤형 음성 합성
음성과 사운드 이펙트 생성에서의 최첨단 제어 가능성
오디오 인필링을 통한 사운드 이펙트 개선 및 사운드 편집 기능
용어 및 기능 정리
기능
설명
오디오 생성
음성 입력과 자연어 텍스트 프롬프트의 조합을 통해 사운드 이펙트와 목소리 생성
사운드스케이프 생성
"강이 흐르는 소리와 새들이 지저귀는 소리"와 같은 텍스트 프롬프트를 통한 사운드스케이프 생성
음성 합성
특정 환경이나 감정을 반영한 음성 스타일의 합성
제어 가능성
사용자가 원하는 대로 음성과 사운드 이펙트의 스타일을 지정할 수 있는 강력한 제어 기능
사운드 편집
오디오 인필링을 통해 오디오 세그먼트를 자르고 재생성, 예를 들어 "개 짖는 소리" 같은 사운드 이펙트 추가
Meta는 안전하고 책임 있는 연구를 수행하기 위해 연구자와 학술 기관을 대상으로 Audiobox 사용을 위한 그랜트 신청을 곧 받을 예정입니다. 또한, 오디오 워터마킹과 보이스 인증 기능을 통해 음성 모방이나 기타 남용에 대한 우려를 해소하기 위한 기술을 도입하였습니다. 향후, Audiobox와 같은 연구 혁신이 오디오 생성의 접근성 장벽을 낮추고 누구나 오디오 콘텐츠 제작자가 될 수 있도록 도울 것으로 기대하고 있습니다.
/haebom
Subscribe
저성장 시대에 우리가 기억해야할 것
"THE WEALTH OF WORKING NATIONS"는 일본 경제의 장기적 저성장을 다루며, GDP 성장률과 인구 고령화의 관계를 분석합니다. 일본은 1990년부터 2019년까지 낮은 GDP 성장률을 보였으나, 생산가능인구 1인당 GDP 성장률로 측정하면 미국과 비슷한 수준을 유지했습니다. 이는 인구 감소가 전체 GDP 성장률에 미치는 영향을 반영한 결과입니다. 이러한 관점은 한국의 현재 경제 상황에도 적용될 수 있으며, 저출산과 고령화가 경제에 미치는 영향을 새롭게 평가하는 데 도움이 됩니다. 논문은 이를 통해 인구 고령화가 진행된 나라들의 경제 성과를 올바르게 평가하는 새로운 시각을 제공합니다. 배울 점 인구 고령화 인식: 일본은 인구 고령화가 경제 성장에 미치는 영향을 인식하고, 이에 대응하는 정책을 수립했습니다. 한국도 이와 같은 인구 변화를 인정하고 경제 정책에 반영해야 합니다. GDP 측정 방식의 재평가: 일본은 전통적인 GDP 측정 방식이 인구 고령화를 반영하지 못한다는 점을 인식하고, 생산가능인구 1인당 GDP 성장률로 평가하는 방식을 도입했습니다. 한국 역시 GDP 측정 방식을 재고려할 필요가 있습니다. 경제 정책의 재조정: 일본은 경제 정책을 인구 고령화와 저출산 문제에 맞추어 조정했습니다. 한국도 유사한 문제에 직면해 있으므로, 경제 정책을 재조정하고 인구 구조 변화에 적응할 필요가 있습니다. 일본의 경우, 전통적인 GDP 성장률이 낮게 나타났지만, 생산가능인구 1인당 GDP 성장률로 볼 때 미국과 거의 유사한 성과를 보였습니다. 이는 일본이 인구 감소의 영향을 받았음을 보여줍니다. 이러한 분석은 한국의 현재 경제 상황에도 적용될 수 있으며, 저출산 및 고령화 문제에 대한 새로운 평가 방법을 제공합니다. 한국 경제의 현재 상황 2023년 3분기 성장률: 한국 경제는 2023년 3분기에 0.6% 성장했습니다. 이는 이전 분기와 동일한 수치로, 연간으로는 1.4% 성장을 기록했습니다​​. 2024년 성장 전망 하향: 한국은행은 2024년 한국의 경제 성장률 전망을 2.2%에서 2.1%로 하향 조정했습니다. 이는 내수 소비 감소와 긴축적 통화 정책을 반영한 결과입니다​​. OECD의 전망: OECD는 2024년 한국 경제 성장률 전망을 2.1%에서 2.3%로 상향 조정했습니다. 이는 수출 회복과 지정학적 긴장 완화를 반영한 것입니다​​. 쌓여있는 문제점 노동 문제: 고령화와 낮은 출산율로 인해 노동력 부족과 생산성 정체가 문제로 지적됩니다​​. 자본시장 도전: 공공 시장의 매력 부족과 사모 및 벤처 투자 시장의 활력 부족이 문제입니다​​. 산업 경쟁력 부족: 주요 산업의 경쟁력 저하와 중소기업의 낮은 생산성이 문제로 지적됩니다​​. 출산율 저하의 영향 사상 최저 출산율: 2023년 3분기 한국의 총출산율은 0.7로, 역대 최저치를 기록했습니다​​. 장기적 경제 영향: 출산율 저하는 장기적으로 노동력 부족과 경제 성장의 둔화를 가져올 것으로 예상됩니다. 일본이 1980년대 이후 저성장 구간에 들어가면서 우리는 흔히 일본의 경제침체를 보며 잃어버린 XX년이라며 이야기를 하곤 했습니다. 이제 대한민국도 그 차례에 서 있습니다. 대한민국도 일본과 같은 고령화, 저출산, 저성장이라는 3단 콤보를 맞이하고 있고 새로운 경제 정책이 필요한 상황입니다. 제가 주식투자 스터디를 운영하면서 구성원들에게 늘 하는 말이 있습니다. 정치를 보지 말고 정책을 봐야한다. 공약을 보지말고 예산을 봐야한다. 피상적인 보도를 볼 것이 아니라 현장을 봐야한다. 점점 이런 이야기가 뚜렷하게 다가오는 기간인 것 같습니다. 일본의 경우 일반적인 총 GDP를 가지고 경제 정책을 설계한 것이 아닌 생산가능인구 1인당 GDP 성장률을 관리했다고 하는데 이 부분이 무척 의미가 깊었습니다. 문제를 잘못 파악하면 애초에 아무리 훌륭한 풀이를 가지고 와도 진짜 문제는 해결되지 않는 것 처럼. 우리도 지금은 대한민국에 맞는 맞춤 지표를 찾아야 할 것 같습니다.
조직의 크기가 팀의 성과로 이어지진 않습니다.
한 때, 실리콘벨리에선 팀을 키우는 것이 주요한 가치로 이야기 되던 때가 있었습니다. 당시 대형 기술 기업들이 조직 성장을 촉진하기 위해 경영진에게 팀 확장을 장려하는 인센티브를 제공하는 방식을 취했습니다. 특히 아마존(Amazon), 페이스북(Facebook), 구글(Google)과 같은 빠르게 성장하는 회사들이 좋은 예시 입니다. 당시 기사들을 보면 유래없는 속도로 팀을 늘리는 것에서 'Big tech'라는 용어와 하나의 Tech기업이 도시의 인구 만큼의 근로자를 데리고 있다고 주목하는 기사들이 있습니다. 이러한 풍조는 국내에서도 이어져 투자를 받은 스타트업이 급하게 팀을 늘리다 일의 규모와 팀의 규모가 맞지 않아 큰 위기를 초례하는 사례를 몇가지 보였습니다. 조직 성장에 대한 인센티브: 빠르게 성장하는 기업에서는 관리자들이 자신의 팀 규모를 확장함으로써 승진과 보상을 받을 가능성이 높아집니다. 팀의 크기가 커지는 것이 승진으로 이어지는 가장 쉬운 방법 중 하나로 여겨졌었습니다. 관리자 승진의 현실: 많은 경우, 관리자의 승진은 팀의 성과나 프로젝트의 성공보다는 팀 규모의 확장에 더 크게 의존합니다. 즉, 관리자는 프로젝트의 성공적인 완료보다는 팀 규모를 늘리는 데 더 많은 관심을 기울일 수 있습니다. 기술 회사의 영향: 이러한 문제는 특히 대형 기술 회사에서 두드러지며, 이러한 중간 관리자 입장에선 자신들이 회사에서 갖는 영향력과 리소스 때문에 관리자들이 팀을 확장하는 데 더욱 적극적일 수 있습니다. 하지만 발생한 부작용 프로젝트 및 팀 성장의 영향: 이러한 인센티브 구조는 관리자들이 팀의 규모를 늘리기 위해 새로운 프로젝트를 제안하거나 지원할 가능성을 높입니다. 이는 기업 내에서 과도한 팀 확장, 비효율적인 프로젝트, 또는 필요하지 않은 프로젝트에 자원이 투입되는 결과를 초래할 수 있습니다. 팀 크기 중심의 승진 모델의 문제점: 이 모델은 팀의 성과나 프로젝트의 성공보다는 단순히 팀의 크기에 중점을 두어, 실제로 조직에 기여하는 것보다는 조직의 규모를 확장하는 데 더 많은 관심을 가지게 합니다. 조직의 비효율성과 과도한 팀 확장의 속도와 비례 합니다. 팀원을 늘리는 것은 그만큼의 복잡성을 추가하는 일이고 이 방법은 무조건 팀의 생산성과 성과와 비례하지 않습니다.
Facebook, Instagram에서 인공지능을 사용하는 방법
페이스북과 인스타그램, 왓츠앱 등을 보유한 메타가 자체 인공지능 기술을 자사 제품들에 실험적으로 도입하고 있다고 공식적으로 밝혔습니다. 제공하는 기능은 AI 생성된 게시물 댓글 제안, 커뮤니티 채팅 주제 제안, 검색 결과 제공, 쇼핑의 제품 설명 개선 등에 사용됩니다. 또한, 창의적인 취미를 가진 사람들을 위한 새로운 독립 실행형 경험인 'imagine with Meta AI'를 구동하고 있습니다. 이는 미드저니 등에서 사용되는 방식으로 특정 명령어를 입력하면 채팅창에서도 쉽게 이미지 생성/개선 등을 도와주는 방식으로 작동 됩니다. 또한 AI 채팅의 경우 항후 출시될 AI Friends의 맛보기로 보여지는데요. @metaai 이후 대화를 시작하면 메타가 제공하는 인공지능 비서와 이야기를 나눌수 있게 한다고 합니다. 개인적으로 인상 깊었던 것은 생일 축하 메세지, 혹은 커뮤니티 글 혹은 무슨 말을 해야할지 몰랐을 때 단문 메세지들을 대신 생성하주는 것과 Firefly 처럼 Outpainting이나 Upscaling이 가능한 이미지 편집툴을 이제 페이스북 인스타그램에서 손쉽게 사용 가능하다는 점이였습니다. 이 기능들은 순차적으로 Meta 유저들에게 적용되고 있으며 내년에는 더욱 강력한 추가 기능들을 적용할 예정이라고 합니다.