Sign In

Relational In-Context Learning via Synthetic Pre-training with Structural Prior

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Yanbo Wang, Jiaxuan You, Chuan Shi, Muhan Zhang

πŸ’‘ κ°œμš”

λ³Έ 논문은 ν…μŠ€νŠΈλ‚˜ λΉ„μ „ 뢄야와 달리 기반 λͺ¨λΈμ΄ λΆ€μ‘±ν•œ κ΄€κ³„ν˜• λ°μ΄ν„°λ² μ΄μŠ€(RDB) λΆ„μ•Όμ˜ 데이터 λΆ€μ‘± 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ ν•©μ„± λ°μ΄ν„°λ§Œμ„ μ‚¬μš©ν•œ 첫 번째 κ΄€κ³„ν˜• 기반 λͺ¨λΈμΈ RDB-PFN을 μ œμ•ˆν•©λ‹ˆλ‹€. ꡬ쑰적 인과 λͺ¨λΈ(SCM)μ—μ„œ μƒμ„±λœ ν•©μ„± 데이터λ₯Ό ν™œμš©ν•˜λŠ” PFN의 아이디어에 μ°©μ•ˆν•˜μ—¬, λ‹€μ–‘ν•œ RDBλ₯Ό λ¬΄ν•œν•˜κ²Œ μƒμ„±ν•˜λŠ” κ΄€κ³„ν˜• 사전 생성기λ₯Ό μ„€κ³„ν–ˆμŠ΅λ‹ˆλ‹€. 200만 개 μ΄μƒμ˜ ν•©μ„± 단일 ν…Œμ΄λΈ” 및 κ΄€κ³„ν˜• μž‘μ—…μ„ 사전 ν›ˆλ ¨ν•œ RDB-PFN은 κ²½λŸ‰ μ•„ν‚€ν…μ²˜μ™€ λΉ λ₯Έ μΆ”λ‘  μ†λ„λ‘œλ„ μ‹€μ œ 19개 κ΄€κ³„ν˜• 예츑 μž‘μ—…μ—μ„œ λ›°μ–΄λ‚œ μ†Œμˆ˜μƒ·(few-shot) μ„±λŠ₯을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κ΄€κ³„ν˜• λ°μ΄ν„°λ² μ΄μŠ€λ₯Ό μœ„ν•œ 졜초의 ν•©μ„± 데이터 기반 기반 λͺ¨λΈ: RDB λΆ„μ•Όμ˜ 고질적인 데이터 λΆ€μ‘± 문제λ₯Ό κ·Ήλ³΅ν•˜κ³  μΌλ°˜ν™” κ°€λŠ₯ν•œ λͺ¨λΈμ„ ꡬ좕할 κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ‹€μ œ λ°μ΄ν„°μ…‹μ—μ„œμ˜ μš°μˆ˜ν•œ μ†Œμˆ˜μƒ· μ„±λŠ₯: 적은 수의 μ˜ˆμ‹œλ§ŒμœΌλ‘œλ„ μƒˆλ‘œμš΄ λ°μ΄ν„°λ² μ΄μŠ€μ— μ¦‰μ‹œ μ μ‘ν•˜μ—¬ μ‹€μ œ 예츑 μž‘μ—…μ—μ„œ μ΅œμ‹  λͺ¨λΈλ“€μ„ λŠ₯κ°€ν•˜λŠ” μ„±λŠ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
κ²½λŸ‰ μ•„ν‚€ν…μ²˜ 및 λΉ λ₯Έ μΆ”λ‘  속도: 효율적인 λͺ¨λΈ μ„€κ³„λ‘œ 인해 μ‹€μš©μ μΈ 적용 κ°€λŠ₯성을 λ†’μ˜€μŠ΅λ‹ˆλ‹€.
β€’
ν•©μ„± λ°μ΄ν„°μ˜ ν˜„μ‹€ 반영 ν•œκ³„: ν•©μ„± 데이터 생성 κ³Όμ •μ—μ„œ μ‹€μ œ RDB의 λ³΅μž‘μ„±, μ˜ˆμ™Έ 상황, λ°μ΄ν„°μ˜ λΉ„λŒ€μΉ­μ„± 등을 μ™„λ²½ν•˜κ²Œ λ°˜μ˜ν•˜κΈ° μ–΄λ €μšΈ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
ꡬ쑰적 사전 μ •λ³΄μ˜ μ œμ•½: SCM 기반의 ν•©μ„± 데이터 생성은 νŠΉμ • μ’…λ₯˜μ˜ ꡬ쑰적 사전 정보에 μ˜μ‘΄ν•˜λ©°, 이 정보가 μ œν•œμ μΌ 경우 λͺ¨λΈμ˜ μΌλ°˜ν™” λŠ₯λ ₯에 ν•œκ³„κ°€ μžˆμ„ 수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘