Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Pap2Pat: Benchmarking Outline-Guided Long-Text Patent Generation with Patent-Paper Pairs

Created by
  • Haebom

저자

Valentin Knappich, Simon Razniewski, Anna Hatty, Annemarie Friedrich

개요

본 논문은 특허 작성과 같은 시간 및 비용이 많이 드는 과정에서 대규모 언어 모델(LLM)의 잠재력을 활용하는 데 초점을 맞추고 있습니다. 특히 특허 명세서의 자동 생성에 대한 연구가 부족한 점을 지적하며, 기존 연구의 부족을 해결하기 위해 1,800개의 특허-논문 쌍으로 구성된 개방형이고 현실적인 특허 작성 벤치마크 PAP2PAT을 제시합니다. 연구 논문을 발명 설명으로 활용하여 청크 기반 개요 지도 생성 방식을 제안하고, PAP2PAT와 인간 참여 연구를 통해 LLM이 논문 정보를 효과적으로 활용할 수 있지만 여전히 세부 정보 제공에 어려움을 겪는다는 점을 보여줍니다. 미세 조정을 통해 특허 스타일 언어를 개선할 수 있지만, 환각(hallucination) 문제 또한 증가하는 것을 확인했습니다. 데이터와 코드는 공개적으로 제공합니다 (https://github.com/boschresearch/Pap2Pat).

시사점, 한계점

시사점:
LLM을 활용한 특허 명세서 자동 생성에 대한 현실적인 벤치마크 PAP2PAT 제공.
청크 기반 개요 지도 생성 방식을 통한 LLM 기반 특허 작성 성능 개선 가능성 제시.
LLM이 연구 논문 정보를 효과적으로 활용할 수 있음을 실증.
공개 데이터셋 및 코드 제공을 통한 추가 연구 촉진.
한계점:
LLM이 여전히 세부 정보 제공에 어려움을 겪음.
미세 조정을 통한 특허 스타일 언어 개선은 환각(hallucination) 문제를 야기할 수 있음.
👍