Sign In

Belief or Circuitry? Causal Evidence for In-Context Graph Learning

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Katharine Kowalyshyn, Timothy Duggan, Daniel Little, Michael C Hughes

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)이 μ»¨ν…μŠ€νŠΈ λ‚΄μ—μ„œ μ–΄λ–»κ²Œ ν•™μŠ΅ν•˜λŠ”μ§€μ— λŒ€ν•œ 근본적인 μ§ˆλ¬Έμ„ νƒκ΅¬ν•©λ‹ˆλ‹€. μ €μžλ“€μ€ λ¬΄μž‘μœ„ κ·Έλž˜ν”„ μΆ”μ μ΄λΌλŠ” κ°„λ‹¨ν•œ μž‘μ—…μ„ 톡해, LLM이 λ‹¨μˆœνžˆ 졜근 토큰을 νŒ¨ν„΄ λ§€μΉ­ν•˜λŠ” 것이 μ•„λ‹ˆλΌ 잠재된 ꡬ쑰λ₯Ό μΆ”λ‘ ν•  수 μžˆλ‹€λŠ” 인과적 증거λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ΄ λͺ…ν™•ν•œ ꡬ쑰 μΆ”λ‘  νšŒλ‘œμ™€ ν•¨κ»˜ μž‘λ™ν•˜λŠ” 이쀑 λ©”μ»€λ‹ˆμ¦˜μ„ ν™œμš©ν•œλ‹€λŠ” 것을 μ‹œμ‚¬ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM은 μ»¨ν…μŠ€νŠΈ λ‚΄ ν•™μŠ΅ μ‹œ λ‹¨μˆœνžˆ ν‘œλ©΄μ μΈ νŒ¨ν„΄μ„ λ„˜μ–΄μ„  잠재된 ꡬ쑰λ₯Ό μΆ”λ‘ ν•˜λŠ” λŠ₯λ ₯을 κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€.
β€’
λͺ¨λΈμ˜ λ‚΄λΆ€ ν‘œν˜„μ€ μ—¬λŸ¬ κ·Έλž˜ν”„ ν† ν΄λ‘œμ§€λ₯Ό λ™μ‹œμ—, 그리고 μ§κ΅ν•˜λŠ” μ£Ό 뢀곡간에 인코딩할 수 있으며, μ΄λŠ” λ‹¨μˆœν•œ 지역적 μ „ν™˜ λ³΅μ‚¬λ‘œλŠ” μ„€λͺ…ν•˜κΈ° μ–΄λ ΅μŠ΅λ‹ˆλ‹€.
β€’
ν›„κΈ° λ ˆμ΄μ–΄μ˜ ν™œμ„±ν™” 패칭과 κ·Έλž˜ν”„ 차이 μŠ€ν‹°μ–΄λ§μ„ ν†΅ν•œ 인과적 κ°œμž… μ‹€ν—˜μ€ λͺ¨λΈμ΄ κ·Έλž˜ν”„ ꡬ쑰 μ‹ ν˜Έλ₯Ό 효과적으둜 ν™œμš©ν•¨μ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ 이쀑 λ©”μ»€λ‹ˆμ¦˜(ꡬ쑰 μΆ”λ‘  νšŒλ‘œμ™€ 병렬 μž‘λ™)은 μ‹€ν—˜ κ²°κ³Όλ₯Ό κ°€μž₯ 잘 μ„€λͺ…ν•©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” 인과적 κ°œμž…μ„ 톡해 LLM의 μž‘λ™ 방식을 μ΄ν•΄ν•˜λŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ‹œν•˜μ§€λ§Œ, μ œμ•ˆλœ 이쀑 λ©”μ»€λ‹ˆμ¦˜μ˜ ꡬ체적인 회둜 ꡬ쑰와 μƒν˜Έμž‘μš©μ— λŒ€ν•œ 더 κΉŠμ€ 뢄석이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘