Pap2Pat: Benchmarking Outline-Guided Long-Text Patent Generation with Patent-Paper Pairs
Created by
Haebom
저자
Valentin Knappich, Simon Razniewski, Anna Hatty, Annemarie Friedrich
개요
본 논문은 특허 작성과 같은 시간 및 비용이 많이 드는 과정에서 대규모 언어 모델(LLM)의 잠재력을 활용하는 데 초점을 맞추고 있습니다. 특히 특허 명세서의 자동 생성에 대한 연구가 부족한 점을 지적하며, 기존 연구의 부족을 해결하기 위해 1,800개의 특허-논문 쌍으로 구성된 개방형이고 현실적인 특허 작성 벤치마크 PAP2PAT을 제시합니다. 연구 논문을 발명 설명으로 활용하여 청크 기반 개요 지도 생성 방식을 제안하고, PAP2PAT와 인간 참여 연구를 통해 LLM이 논문 정보를 효과적으로 활용할 수 있지만 여전히 세부 정보 제공에 어려움을 겪는다는 점을 보여줍니다. 미세 조정을 통해 특허 스타일 언어를 개선할 수 있지만, 환각(hallucination) 문제 또한 증가하는 것을 확인했습니다. 데이터와 코드는 공개적으로 제공합니다 (https://github.com/boschresearch/Pap2Pat).