Sign In

CORE-T: COherent REtrieval of Tables for Text-to-SQL

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Hassan Soliman, Vivek Gupta, Dan Roth, Iryna Gurevych

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ—¬λŸ¬ ν…Œμ΄λΈ”μ„ 쑰인해야 ν•˜λŠ” λ³΅μž‘ν•œ Text-to-SQL μž‘μ—…μ—μ„œ κ΄€λ ¨ ν…Œμ΄λΈ”μ„ μ •ν™•ν•˜κ²Œ κ²€μƒ‰ν•˜λŠ” 문제λ₯Ό ν•΄κ²°ν•˜κ³ μž ν•©λ‹ˆλ‹€. μ œμ•ˆλœ CORE-T ν”„λ ˆμž„μ›Œν¬λŠ” LLM을 ν™œμš©ν•˜μ—¬ ν…Œμ΄λΈ”μ˜ λͺ©μ  메타데이터λ₯Ό μƒμ„±ν•˜κ³ , κ²½λŸ‰ν™”λœ ν…Œμ΄λΈ” ν˜Έν™˜μ„± μΊμ‹œλ₯Ό 사전 κ³„μ‚°ν•˜μ—¬ νš¨μœ¨μ„±μ„ λ†’μž…λ‹ˆλ‹€. 이λ₯Ό 톡해 높은 μž¬ν˜„μœ¨μ„ κ°€μ§€μ§€λ§Œ λ…Έμ΄μ¦ˆκ°€ λ§Žμ€ κΈ°μ‘΄ Dense Retrieval λ°©μ‹μ˜ 단점을 λ³΄μ™„ν•˜κ³ , λ³΅μž‘ν•œ 쑰인 λ‘œμ§μ΄λ‚˜ 높은 μΆ”λ‘  λΉ„μš© 없이도 효율적으둜 ν…Œμ΄λΈ”μ„ μ„ νƒν•˜κ³  μ‹€ν–‰ 정확도λ₯Ό ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
도메인 지식 λΆ€μ‘± 문제 ν•΄κ²°: LLM이 μƒμ„±ν•œ λͺ©μ  메타데이터λ₯Ό ν™œμš©ν•˜μ—¬ λͺ…μ‹œμ μΈ λ°μ΄ν„°λ² μ΄μŠ€ μ‹λ³„μžκ°€ μ—†λŠ” μƒν™©μ—μ„œλ„ ν…Œμ΄λΈ”μ˜ μ˜λ―Έμ™€ 관계λ₯Ό νŒŒμ•…ν•˜λŠ” 데 도움을 μ€λ‹ˆλ‹€.
β€’
효율적인 ν…Œμ΄λΈ” 검색: Dense Retrieval의 높은 μž¬ν˜„μœ¨κ³Ό LLM 기반 필터링을 κ²°ν•©ν•˜μ—¬, 정확도λ₯Ό λ†’μ΄λ©΄μ„œλ„ μΆ”λ‘  μ˜€λ²„ν—€λ“œλ₯Ό 쀄이고 μ„ νƒλ˜λŠ” ν…Œμ΄λΈ” 수λ₯Ό κ°μ†Œμ‹œν‚΅λ‹ˆλ‹€.
β€’
μ‹€ν–‰ 정확도 ν–₯상: μ œμ•ˆλœ 방식은 기쑴의 Dense Retrieval 및 LLM μ€‘μ‹¬μ˜ 베이슀라인 λŒ€λΉ„ ν…Œμ΄λΈ” 선택 F1 μ μˆ˜μ™€ 닀쀑 ν…Œμ΄λΈ” μ‹€ν–‰ 정확도λ₯Ό 크게 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.
β€’
ν•œκ³„μ : LLM 기반 메타데이터 생성 및 μ΅œμ’… 선택 λ‹¨κ³„μ—μ„œ μ—¬μ „νžˆ LLM 호좜이 ν•„μš”ν•˜λ©°, μ΄λŠ” μ²˜λ¦¬λŸ‰μ΄λ‚˜ λΉ„μš© μΈ‘λ©΄μ—μ„œ μ œμ•½μ΄ 될 수 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, μ œμ•ˆλœ μΊμ‹œ λ©”μ»€λ‹ˆμ¦˜μ˜ ν™•μž₯μ„± 및 μ΅œμ ν™”μ— λŒ€ν•œ μΆ”κ°€ 연ꡬ가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘