Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PatentScore: Multi-dimensional Evaluation of LLM-Generated Patent Claims

Created by
  • Haebom

저자

Yongmin Yoo, Qiongkai Xu, Longbing Cao

개요

본 논문은 대규모 언어 모델(LLM)이 생성한 특허 청구항의 품질 평가를 위한 다차원 평가 프레임워크인 PatentScore를 제안한다. 기존의 자연어 생성(NLG) 평가 지표는 특허 문서의 구조적, 법적 특성에 적합하지 않다는 점을 고려하여, PatentScore는 청구항 분석을 위한 계층적 분해, 법적 및 기술적 표준에 기반한 도메인 특정 검증 패턴, 구조적, 의미론적, 법적 차원에 걸친 점수 매기기를 통합한다. GPT-4, Claude-3.5-Haiku, Gemini-1.5-flash 등 다양한 LLM로 생성된 400개의 청구항 1에 대한 평가 결과 전문가 평가와 높은 상관관계(Pearson correlation $r = 0.819$)를 보이며, 기존 NLG 지표보다 우수한 성능을 나타낸다.

시사점, 한계점

시사점:
LLM 기반 특허 생성 기술의 발전에 필수적인, 특허 청구항 평가를 위한 새로운 프레임워크를 제시한다.
기존 NLG 지표의 한계를 극복하고, 특허 문서의 구조적, 법적 특성을 고려한 평가를 가능하게 한다.
다양한 LLM에 대한 평가 결과를 통해 PatentScore의 견고성과 일반화 가능성을 확인한다.
전문가 평가와의 높은 상관관계를 통해 PatentScore의 유효성을 입증한다.
한계점:
현재는 청구항 1에 대한 평가에 국한되어 있으며, 다른 청구항 유형이나 특허 문서의 다른 부분에 대한 적용 가능성은 추가 연구가 필요하다.
사용된 LLM의 종류가 제한적일 수 있으며, 더 다양한 LLM에 대한 평가가 필요하다.
전문가 평가의 주관성이 결과에 영향을 미칠 수 있다.
PatentScore의 계산 과정 및 구체적인 알고리즘에 대한 상세한 설명이 부족할 수 있다.
👍