Sign In

Large Language Models as Nondeterministic Causal Models

Created by
  • Haebom
Category
Empty

์ €์ž

Sander Beckers

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ์—ฐ๊ตฌ๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ํ–‰๋™์„ ์ดํ•ดํ•˜๊ณ  ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•œ ํ•„์ˆ˜ ๋‹จ๊ณ„์ธ ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก (counterfactual inference) ์ƒ์„ฑ ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ๋…ผํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด ๋ฐฉ๋ฒ•์€ LLM์˜ ์ƒ˜ํ”Œ๋ง ๊ณผ์ •์„ ๋ณ€๊ฒฝํ•˜๋ฉด์„œ LLM ์ž์ฒด๋Š” ๋ณ€๊ฒฝํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ๋ชจํ˜ธํ•œ ํ•ด์„์— ๊ธฐ๋ฐ˜ํ•˜๋ฉฐ, ๋น„๊ฒฐ์ •์  LLM์„ ๊ฒฐ์ •๋ก ์  ์ธ๊ณผ ๋ชจ๋ธ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์€ LLM์„ ๋น„๊ฒฐ์ •๋ก ์  ์ธ๊ณผ ๋ชจ๋ธ๋กœ ์ง์ ‘ ํ‘œํ˜„ํ•˜๋Š” ๋”์šฑ ๋‹จ์ˆœํ•˜๊ณ  ์ง๊ด€์ ์ธ ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก  ์ƒ์„ฑ ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•์€ LLM์˜ ์˜๋„๋œ ์˜๋ฏธ๋ก ์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก ์„ ์ƒ์„ฑํ•˜๋ฉฐ, ๋ธ”๋ž™๋ฐ•์Šค LLM์—๋„ ์ˆ˜์ • ์—†์ด ์ง์ ‘ ์ ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
โ€ข
LLM์˜ ๋น„๊ฒฐ์ •๋ก ์  ํŠน์„ฑ์„ ๊ณ ๋ คํ•œ ์ธ๊ณผ ๋ชจ๋ธ๋ง์„ ํ†ตํ•ด LLM ํ–‰๋™์— ๋Œ€ํ•œ ๋” ์ •ํ™•ํ•œ ์ดํ•ด์˜ ๊ธฐ๋ฐ˜์„ ๋งˆ๋ จํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๊ธฐ์กด ๋ฐฉ๋ฒ•๊ณผ ์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•์˜ ๊ด€๊ณ„๋ฅผ ์ด๋ก ์ ์œผ๋กœ ๋ช…ํ™•ํžˆ ํ•˜๊ณ , ํ–ฅํ›„ ์‘์šฉ ๋ถ„์•ผ์— ํŠนํ™”๋œ ์ƒˆ๋กœ์šด ๋ฐ˜์‚ฌ์‹ค์  ์ถ”๋ก  ์ƒ์„ฑ ๋ฐฉ๋ฒ• ๊ฐœ๋ฐœ์˜ ํ† ๋Œ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘