Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Retrieval-Augmented Generation Systems for Intellectual Property via Synthetic Multi-Angle Fine-tuning

Created by
  • Haebom

저자

Runtao Ren, Jian Ma, Jianxi Luo

개요

본 논문은 지적재산권(IP) 분야에서 다양한 사용자 질의(구어체, 오타, 모호한 용어 포함)로 인해 정확한 검색 및 최적의 응답이 어려운 검색 증강 생성(RAG) 시스템의 문제를 해결하기 위해, 다각적 질문 생성 및 검색 미세조정 방법(MQG-RFM)을 제안합니다. MQG-RFM은 대규모 언어 모델(LLM)을 활용하여 다양한 사용자 질의를 시뮬레이션하고, 의미적으로 동일하지만 언어적으로 다양한 질문을 정렬하도록 검색 모델을 미세 조정합니다. 복잡한 구조 변경 대신 경량의 데이터 기반 미세조정 패러다임을 채택하여 프롬프트 엔지니어링 기반 질문 생성과 하드 네거티브 마이닝을 결합하여 비용 효율적으로 검색의 견고성을 향상시킵니다. 대만 특허 Q&A 데이터셋 실험 결과, 특허 상담 데이터셋에서 검색 정확도가 185.62%, 새로운 특허 기술 보고서 데이터셋에서 262.26% 향상되었고, 기준 모델 대비 생성 품질은 각각 14.22%와 53.58% 향상되었습니다. 중국 최대 전문 연구 소셜 네트워킹 플랫폼인 ScholarMate에서 실제 적용되었으며, 데모 버전은 GitHub에서 확인 가능합니다.

시사점, 한계점

시사점:
다양한 사용자 질의에 대한 RAG 시스템의 검색 정확도와 생성 품질을 크게 향상시키는 효과적인 방법 제시.
경량의 데이터 기반 미세조정 패러다임을 통해 비용 효율적이고 확장 가능한 솔루션 제공.
실제 서비스(ScholarMate)에 적용되어 실효성을 검증.
중소기관의 신뢰할 수 있는 특허 정보 솔루션 확보에 기여.
한계점:
대만 특허 Q&A 데이터셋에 대한 실험 결과만 제시되어 일반화 가능성에 대한 추가 연구 필요.
사용된 LLM 및 데이터셋의 특성에 따라 성능이 달라질 수 있음.
다른 언어 또는 다른 도메인으로의 적용 가능성에 대한 추가 연구 필요.
👍