빅테크 기업, AI 학습 데이터 수집을 위한 ‘골드러시’
사진 1~2달러, 영상 2~4달러, 문서는 1000자에 1달러 거래 생성형 인공지능(AI) 개발에 있어 데이터 수집이 핵심 요소로 부상하고 있습니다. 빅테크 기업들은 AI 학습을 위해 사진, 영상, 문서 등 다양한 데이터를 대량으로 구입하며 '데이터 골드러시'를 경험하고 있습니다. 특히, 사진은 1~2달러, 영상은 2~4달러, 문서는 1000자에 1달러의 가격으로 거래되고 있습니다. 이러한 데이터 수집은 저작권 문제로 인해 무료 데이터의 사용이 제한됨에 따라 더욱 확대되고 있습니다. 오픈AI는 100만 시간의 유튜브 영상을 통해 텍스트를 수집하여 GPT-4의 학습에 활용했으며, 이런 추세는 AI 모델의 성능 향상에 결정적인 영향을 미칩니다. 또한, AI가 생성한 데이터를 활용하여 저작권 문제를 해결하고자 하는 노력도 이루어지고 있어, 이 분야의 혁신은 계속될 것으로 보입니다. 이처럼 데이터의 중요성이 강조되는 시대에서, 데이터의 윤리적 수집과 활용에 대한 철저한 규제와 가이드라인 마련이 절실히 요구된다고 생각합니다. <원문 링크>
2