Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

DeepInnovation AI: A Global Dataset Mapping the AI innovation from Academic Research to Industrial Patents

Created by
  • Haebom

저자

Haixing Gong, Hui Zou, Xingzhou Liang, Shiyuan Meng, Pinlong Cai, Xingcheng Xu, Jingjing Qu

개요

DeepInnovationAI는 AI 분야의 혁신 패턴을 매핑하고 연구에서 응용으로의 효과적인 기술 이전을 이해하기 위해 개발된 포괄적인 글로벌 데이터셋입니다. 2,356,204건의 특허 기록과 3,511,929건의 학술 출판물을 포함하며, 대규모 언어 모델, 다국어 텍스트 분석, 이중 계층 BERT 분류기를 활용하여 AI 관련 콘텐츠를 정확하게 식별하고, 초그래프 분석을 통해 견고한 혁신 지표를 생성합니다. 또한, 의미 벡터 근접도 분석을 통해 약 1억 개의 논문-특허 유사성 쌍을 제공하여 이론적 발전이 상업 기술로 어떻게 전환되는지 이해하는 데 도움을 줍니다. 이 데이터셋은 연구자, 정책 입안자, 업계 리더들이 동향을 예측하고 협업 기회를 파악하는 데 활용될 수 있습니다.

시사점, 한계점

시사점:
AI 혁신 패턴의 포괄적이고 정량적인 분석 가능
연구와 상업화 간 기술 이전 과정에 대한 심층적 이해 증진
AI 분야의 기술 개발 패턴 및 국제 경쟁 역학에 대한 상세 분석 지원
AI 혁신 및 기술 이전 과정 모델링을 위한 기반 마련
정책 결정 및 산업 전략 수립에 유용한 정보 제공
한계점:
데이터셋의 완전성 및 정확성에 대한 지속적인 검증 필요
AI 관련 콘텐츠 식별의 정확도 한계
의미 벡터 근접도 분석의 한계로 인한 유사성 측정의 오류 가능성
데이터셋의 규모에도 불구하고, 특정 분야 또는 지역에 대한 데이터 부족 가능성
데이터셋의 지속적인 업데이트 및 유지보수 필요성
👍