스탠포드 대학교의 인간 중심 인공지능 연구소(HAI)가 발표한 2025년 AI 인덱스 보고서는 전 세계 인공지능 발전 현황을 포괄적으로 분석한 자료입니다. 8번째 발간되는 이번 보고서는 AI 기술 성능, 경제적 영향, 교육, 정책, 책임감 있는 AI 등 다양한 측면을 데이터 기반으로 추적하고 시각화하여 AI의 급속한 발전을 이해할 수 있는 경험적 토대를 제공합니다. • AI 기술 성능은 계속해서 놀라운 속도로 향상 • 미국은 핵심 모델 개발 분야에서 여전히 선두, 중국은 격차 빠르게 좁혀 • 기업 AI 투자 사상 최대 기록, 정부 규제도 증가 • 일상에 빠르게 자리 잡는 AI, 비용은 감소하고 효율성은 증가 • 책임 있는 AI 생태계 발전 불균형, 국가 간 AI 인식 차이 뚜렷 • 과학 분야 AI 기여도 증가, 추론 능력은 여전히 과제로 남아 AI 기술 성능의 꾸준한 향상 2023년에 도입된 MMMU, GPQA, SWE-bench와 같은 까다로운 벤치마크에서 AI 성능이 불과 1년 만에 급격히 향상되었습니다. MMMU에서는 18.8%, GPQA에서는 48.9%, SWE-bench에서는 67.3%의 점수 상승이 있었습니다. 최신 AI 모델들은 고품질 비디오 생성 능력도 크게 향상되었으며, 일부 환경에서는 에이전트 AI 모델이 인간보다 뛰어난 성능을 보이기도 했습니다. 특히 주목할 점은 주요 벤치마크에서 상위 모델과 10위권 모델 간의 성능 차이가 1년 만에 11.9%에서 5.4%로 줄어들었고, 상위 두 모델 간의 차이는 불과 0.7%에 불과하다는 것입니다. 이는 최첨단 AI 기술 경쟁이 점점 치열해지고 있음을 시사합니다. 일상생활에 스며드는 AI 의료부터 교통까지, AI는 실험실에서 일상생활로 빠르게 이동하고 있습니다. 2024년 8월 기준으로 FDA는 950개의 AI 기반 의료기기를 승인했는데, 이는 2015년 6개, 2023년 221개에서 크게 증가한 수치입니다. 도로에서는 자율주행차가 더 이상 실험적 단계가 아닙니다. 미국의 주요 자율주행차 운영업체인 웨이모(Waymo)는 현재 매주 15만 건 이상의 자율주행 라이드를 제공하고 있습니다. AI 모델이 더욱 효율적이고 저렴해지며 접근성도 높아지고 있습니다. GPT-3.5 수준의 시스템의 추론 비용이 2022년 11월부터 2024년 10월 사이에 280배 이상 감소했습니다. 하드웨어 수준에서는, 비용이 매년 30% 감소했고 에너지 효율성은 매년 40% 향상되었습니다. 또한, 오픈 웨이트 모델도 클로즈드 모델과의 격차를 좁히면서, 일부 벤치마크에서 성능 차이가 1년 만에 8%에서 1.7%로 줄어들었습니다. 이러한 추세들은 고급 AI에 대한 장벽을 빠르게 낮추고 있습니다. 기업의 적극적인 AI 투자와 모델 개발 경쟁 2024년 미국의 민간 AI 투자는 1,091억 달러로 증가했으며, 이는 중국의 93억 달러와 영국의 45억 달러에 비해 압도적인 규모입니다. 특히 생성형 AI는 전 세계적으로 339억 달러의 민간 투자를 유치했는데, 이는 2023년 대비 18.7% 증가한 수치입니다. 기업의 AI 도입도 가속화되어 2024년에는 78%의 조직이 AI를 사용한다고 보고했는데, 이는 전년도의 55%에서 크게 상승한 것입니다. 모델 개발에서 미국은 2024년에 40개의 주목할 만한 AI 모델을 생산하여 중국의 15개와 유럽의 3개를 크게 앞섰습니다. 그러나 양적인 면에서 미국이 여전히 앞서고 있지만, 중국 모델들은 품질 격차를 빠르게 좁히고 있습니다. MMLU와 HumanEval과 같은 주요 벤치마크에서의 성능 차이는 2023년 두 자릿수에서 2024년에는 거의 동등한 수준으로 줄어들었습니다. 한편, 중국은 AI 출판물과 특허에서 계속 선두를 유지하고 있습니다. 하지만 AI 모델 훈련 비용이 크게 증가하고 있다는 점도 주목할 만합니다. 구글의 Gemini 1.0 Ultra 모델의 훈련 비용은 약 1억 9,200만 달러로 추정됩니다. 이는 훈련 시간, 하드웨어 유형 및 양 등을 기반으로 한 추정치입니다. 일반적으로 모델 매개변수 수, 훈련 시간, 훈련 데이터의 양이 계속 증가하면서 훈련 비용도 함께 증가하고 있습니다. 책임 있는 AI와 전 세계 인식 차이 AI 관련 사고는 급격히 증가하고 있으나, 주요 산업 모델 개발자들 사이에서 표준화된 책임 있는 AI(RAI) 평가는 여전히 드문 현상입니다. 그러나 HELM Safety, AIR-Bench, FACTS와 같은 새로운 벤치마크는 사실성과 안전성을 평가하는 유망한 도구를 제공하고 있습니다. 기업들 사이에서는 RAI 위험을 인식하는 것과 의미 있는 조치를 취하는 것 사이에 여전히 격차가 존재합니다. 반면, 정부들은 증가된 긴급성을 보이고 있습니다. 2024년에는 AI 거버넌스에 대한 글로벌 협력이 강화되었으며, OECD, EU, UN, 아프리카 연합을 포함한 조직들이 투명성, 신뢰성 및 기타 핵심 RAI 원칙에 초점을 맞춘 프레임워크를 발표했습니다. 전 세계적으로 AI에 대한 낙관론은 증가하고 있지만, 지역 간 깊은 격차는 여전히 존재합니다. 중국(83%), 인도네시아(80%), 태국(77%) 같은 국가에서는 대다수가 AI 제품과 서비스가 해보다 이익이 더 크다고 보고 있습니다. 반면, 캐나다(40%), 미국(39%), 네덜란드(36%)와 같은 곳에서는 낙관론이 훨씬 낮게 유지되고 있습니다. 그러나 이러한 감정은 변화하고 있습니다. 2022년 이후, 이전에 회의적이었던 국가들에서 낙관론이 크게 성장했습니다. 독일(+10%), 프랑스(+10%), 캐나다(+8%), 영국(+8%), 미국(+4%)을 포함합니다.