본 논문은 인공지능(AI) 분야의 혁신 패턴을 매핑하고 학술 연구에서 실제 응용으로의 효과적인 기술 이전을 이해하는 것이 경제 성장에 필수적임을 강조합니다. 기존 데이터 인프라의 단편화, 불완전한 적용 범위, 부족한 평가 능력 등의 한계를 극복하기 위해, 학술 논문과 산업 특허 간의 간극을 메우는 것을 목표로 하는 포괄적인 글로벌 데이터셋 DeepInnovationAI를 제시합니다. DeepInnovationAI는 2,356,204건의 특허 기록과 3,511,929건의 학술 출판물을 포함하며, 대규모 언어 모델, 다국어 텍스트 분석, 이중 레이어 BERT 분류기를 사용하여 AI 관련 콘텐츠를 정확하게 식별하고, 초하이퍼그래프 분석 방법을 사용하여 강력한 혁신 지표를 생성합니다. 또한, 의미 벡터 근접도 분석을 적용하여 약 1억 개의 논문-특허 유사성 쌍을 제공하여 이론적 발전이 상업 기술로 어떻게 전환되는지 이해를 높입니다. 이를 통해 기술 개발 패턴 및 국제 경쟁 역학에 대한 상세한 분석을 지원하고, AI 혁신 역학 및 기술 이전 과정을 모델링하기 위한 강력한 기반을 제공합니다.