๋ณธ ์ฐ๊ตฌ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ฌ์ ํ์ต(pretraining)๊ณผ ๋ฏธ์ธ ์กฐ์ (finetuning) ๊ณผ์ ์์ ์ตํฐ๋ง์ด์ ์ ์ค์์ฑ์ ๊ฐ์กฐํฉ๋๋ค. ์คํ ๊ฒฐ๊ณผ, ์ฌ์ ํ์ต ์ ์ฌ์ฉํ๋ ๊ฒ๊ณผ ๋์ผํ ์ตํฐ๋ง์ด์ ๋ฅผ ์ฌ์ฉํ์ฌ ์ ์ฒด ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ (full finetuning)ํ ๋, ๋ค๋ฅธ ์ตํฐ๋ง์ด์ ๋ LoRA๋ฅผ ์ฌ์ฉํ ๋๋ณด๋ค ์๋ก์ด ์์
์์์ ์ฑ๋ฅ์ ์ ์งํ๊ฑฐ๋ ํฅ์์ํค๋ฉด์ ์ฌ์ ํ์ต๋ ์ง์์ ๋ง๊ฐ์ ์ค์ด๋ ๋ ๋์ ํ์ต-๋ง๊ฐ ์ ์ถฉ(learning-forgetting tradeoff)์ ๋ฌ์ฑํ๋ค๋ ํ์์ ๋ฐ๊ฒฌํ์ต๋๋ค. ์ด๋ฅผ '์ตํฐ๋ง์ด์ -๋ชจ๋ธ ์ผ๊ด์ฑ(optimizer-model consistency)'์ด๋ผ๊ณ ๋ช
๋ช
ํฉ๋๋ค.