Sign In

Memory Inception: Latent-Space KV Cache Manipulation for Steering LLMs

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Andy Zeyi Liu, Michael Zhang, Ilana Greenberg, Adam Alnasser, Lucas Baker, John Sous

πŸ’‘ κ°œμš”

λ³Έ 논문은 LLM(λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ)의 μ œμ–΄λ₯Ό μœ„ν•œ μƒˆλ‘œμš΄ 방법둠인 Memory Inception(MI)을 μ œμ•ˆν•©λ‹ˆλ‹€. MIλŠ” 기쑴의 ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ΄λ‚˜ ν™œμ„±ν™” κ°’ μ‘°μž‘ λ°©μ‹μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄, ν…μŠ€νŠΈμ—μ„œ νŒŒμƒλœ Key-Value(KV) μΊμ‹œλ₯Ό 선택적인 λ ˆμ΄μ–΄μ— μ‚½μž…ν•˜λŠ” λ°©μ‹μœΌλ‘œ μž‘λ™ν•©λ‹ˆλ‹€. 이 방법은 κΈ°μ‘΄ 방식에 λΉ„ν•΄ λ›°μ–΄λ‚œ μ œμ–΄λ ₯κ³Ό νš¨μœ¨μ„±μ„ 보여주며, 특히 κΈ΄ λŒ€ν™”λ‚˜ λ³΅μž‘ν•œ ꡬ쑰적 지침이 ν•„μš”ν•œ κ²½μš°μ— νš¨κ³Όμ μž…λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κ°•λ ₯ν•˜κ³  μœ μ—°ν•œ LLM μ œμ–΄: MIλŠ” ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§κ³Ό μœ μ‚¬ν•œ μˆ˜μ€€μ˜ μ œμ–΄λ ₯을 μ œκ³΅ν•˜λ©΄μ„œλ„, κΈ΄ λŒ€ν™”μ—μ„œ λ°œμƒν•˜λŠ” μΊμ‹œ 뢀담을 쀄이고, ν™œμ„±ν™” κ°’ μ‘°μž‘ λ°©μ‹μ˜ ν•œκ³„λ₯Ό λ„˜μ–΄μ„ λ‹€λŠ” μ μ—μ„œ LLM μ œμ–΄ λΆ„μ•Όμ˜ λ°œμ „μ„ μ œμ‹œν•©λ‹ˆλ‹€.
β€’
효율적인 μžμ› ν™œμš©: 특히 ꡬ쑰적 μΆ”λ‘  μž‘μ—…μ—μ„œ κΈ°μ‘΄ ν”„λ‘¬ν”„νŠΈ 방식 λŒ€λΉ„ KV μ €μž₯ 곡간을 획기적으둜 쀄여, LLM의 μžμ› νš¨μœ¨μ„±μ„ 높일 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
mid-conversation 행동 λ³€ν™” 지원: λŒ€ν™” 도쀑에 λͺ¨λΈμ˜ 행동을 μˆ˜μ •ν•  수 있으며, μ΄λŠ” μ—…λ°μ΄νŠΈ κ°€λŠ₯ν•œ μ§€μΉ¨μ΄λ‚˜ 지속적인 μ œμ–΄κ°€ ν•„μš”ν•œ μ‘μš© λΆ„μ•Όμ—μ„œ μ€‘μš”ν•œ μž₯μ μž…λ‹ˆλ‹€.
β€’
좔가적인 탐색 및 μ΅œμ ν™” ν•„μš”: MI의 μ„±λŠ₯을 λ‹€μ–‘ν•œ LLM μ•„ν‚€ν…μ²˜μ™€ νƒœμŠ€ν¬μ— 걸쳐 λ”μš± κ΄‘λ²”μœ„ν•˜κ²Œ κ²€μ¦ν•˜κ³ , 졜적의 KV μ‚½μž… λ ˆμ΄μ–΄ 및 방식을 νƒμƒ‰ν•˜λŠ” 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘