Sign In

Domain-Specific Data Generation Framework for RAG Adaptation

Created by
  • Haebom
Category
Empty

μ €μž

Chris Xing Tian, Weihao Xie, Zhen Chen, Zhengyuan Yi, Hui Liu, Haoliang Li, Shiqi Wang, Siwei Ma

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ§ˆμ˜μ‘λ‹΅-검색 증강 생성(RAG) μ‹œμŠ€ν…œμ„ νŠΉμ • 도메인에 효과적으둜 μ μš©ν•˜κΈ° μœ„ν•œ 데이터 생성 ν”„λ ˆμž„μ›Œν¬μΈ RAGen을 μ œμ•ˆν•©λ‹ˆλ‹€. RAGen은 λ„νλ¨ΌνŠΈμ—μ„œ 핡심 κ°œλ…μ„ μΆ”μΆœν•˜κ³  Bloom's Taxonomy 원칙을 기반으둜 μ§ˆλ¬Έμ„ μƒμ„±ν•˜λ©°, κ΄€λ ¨ λ¬Έλ§₯μ—μ„œ 닡변을 μΆ”μΆœν•˜μ—¬ 도메인 νŠΉν™”λœ 질문-λ‹΅λ³€-λ¬Έλ§₯(QAC) νŠΈλ¦¬ν”Œμ„ μƒμ„±ν•©λ‹ˆλ‹€. 이 ν”„λ ˆμž„μ›Œν¬λŠ” LLM, 검색기, μž„λ² λ”© λͺ¨λΈ λ“± RAG ꡬ성 μš”μ†Œμ˜ μ΅œμ ν™”λ₯Ό ν¬ν•¨ν•œ λ‹€μ–‘ν•œ RAG 적응 μ „λž΅μ„ μ§€μ›ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
RAGen은 도메인 νŠΉν™”λœ RAG μ‹œμŠ€ν…œ 적응을 μœ„ν•œ ν™•μž₯ κ°€λŠ₯ν•˜κ³  λͺ¨λ“ˆν™”λœ 데이터 생성 ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
μ‹œλ§¨ν‹± μ²­ν‚Ή, 계측적 κ°œλ… μΆ”μΆœ, 닀쀑 청크 검색, μ˜λ„μ μΈ μ˜€λ‹΅ λ¬Έλ§₯ λ„μž… 등을 톡해 κ²¬κ³ ν•œ μΆ”λ‘  λŠ₯λ ₯을 κ°–μΆ˜ QAC 데이터λ₯Ό μƒμ„±ν•©λ‹ˆλ‹€.
β€’
λŒ€κ·œλͺ¨ 및 μ§„ν™”ν•˜λŠ” λ„νλ¨ΌνŠΈ μ½”νΌμŠ€λ₯Ό 효율적으둜 μ²˜λ¦¬ν•  수 μžˆμ–΄ κ³Όν•™ μ—°κ΅¬λ‚˜ κΈ°μ—… 지식 λ² μ΄μŠ€μ™€ 같은 동적 도메인에 μ ν•©ν•©λ‹ˆλ‹€.
β€’
RAGen이 μƒμ„±ν•œ λ°μ΄ν„°μ˜ ν’ˆμ§ˆκ³Ό 닀양성이 μ΅œμ’… RAG μ‹œμŠ€ν…œ μ„±λŠ₯에 λ―ΈμΉ˜λŠ” 영ν–₯을 더 깊이 λΆ„μ„ν•˜κ³ , νŠΉμ • 도메인에 μ΅œμ ν™”λœ 질문 생성 원칙을 λ”μš± μ •κ΅ν•˜κ²Œ λ°œμ „μ‹œν‚¬ ν•„μš”κ°€ μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘