Sign In

FACT-E: Causality-Inspired Evaluation for Trustworthy Chain-of-Thought Reasoning

Created by
  • Haebom
Category
Empty

์ €์ž

Yuxi Sun, Aoqi Zuo, Haotian Xie, Wei Gao, Mingming Gong, Jing Ma

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ์—ฐ์‡„ ์‚ฌ๊ณ (Chain-of-Thought, CoT) ์ถ”๋ก  ๊ณผ์ •์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์„ค๋ช…์˜ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ์ธ FACT-E๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. FACT-E๋Š” ์ธ๊ณผ ๊ด€๊ณ„์—์„œ ์˜๊ฐ์„ ๋ฐ›์•„ ์ œ์–ด๋œ ๊ต๋ž€(controlled perturbations)์„ ์‚ฌ์šฉํ•˜์—ฌ ์ถ”๋ก  ๋‹จ๊ณ„ ๊ฐ„์˜ ์ง„์ •ํ•œ ์˜์กด์„ฑ๊ณผ ํŽธํ–ฅ๋œ ๊ฒฐ๊ณผ๋ฌผ์„ ๋ถ„๋ฆฌํ•˜์—ฌ, ๋‚ด๋ถ€ ์—ฐ์‡„์˜ ์‹ ์‹ค์„ฑ(intra-chain faithfulness)์„ ๋” ์‹ ๋ขฐ์„ฑ ์žˆ๊ฒŒ ์ถ”์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋‚ด๋ถ€ ์—ฐ์‡„์˜ ์‹ ์‹ค์„ฑ๊ณผ ์ตœ์ข… ๋‹ต๋ณ€๊ณผ์˜ ์ผ๊ด€์„ฑ์„ ํ•จ๊ป˜ ๊ณ ๋ คํ•˜์—ฌ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ถ”๋ก  ๊ฒฝ๋กœ๋ฅผ ์„ ํƒํ•˜๊ณ , ๊ฒฐ๊ณผ์ ์œผ๋กœ LLM์˜ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ถ”๋ก ์„ ์œ„ํ•œ ๊ฐ•๋ ฅํ•œ ์ง€ํ‘œ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
CoT ์ถ”๋ก ์˜ ์งˆ์  ํ‰๊ฐ€์—์„œ ๊ธฐ์กด ๋ฐฉ๋ฒ•์˜ ํŽธํ–ฅ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ , ์ธ๊ณผ ๊ด€๊ณ„ ๊ธฐ๋ฐ˜์˜ ๊ต๋ž€์„ ํ†ตํ•ด ๋ณด๋‹ค ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๋‚ด๋ถ€ ์—ฐ์‡„ ์‹ ์‹ค์„ฑ ์ถ”์ •์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋‚ด๋ถ€ ์—ฐ์‡„ ์‹ ์‹ค์„ฑ๊ณผ ์ตœ์ข… ๋‹ต๋ณ€ ์ผ๊ด€์„ฑ์„ ํ•จ๊ป˜ ๊ณ ๋ คํ•˜์—ฌ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” CoT ๊ฒฝ๋กœ๋ฅผ ์„ ํƒํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด ๋” ๋‚˜์€ ์ธ์ปจํ…์ŠคํŠธ ํ•™์Šต ์˜ˆ์ œ๋ฅผ ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
๋…ธ์ด์ฆˆ๊ฐ€ ํฌํ•จ๋œ ์กฐ๊ฑด์—์„œ๋„ ๊ฒฐํ•จ ์žˆ๋Š” ์ถ”๋ก ์„ ์•ˆ์ •์ ์œผ๋กœ ํƒ์ง€ํ•˜์—ฌ LLM ์ถ”๋ก ์˜ ์‹ ๋ขฐ์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•๋ก ์˜ ๊ณ„์‚ฐ ๋ณต์žก์„ฑ ์ฆ๊ฐ€์™€ ํŠน์ • ์œ ํ˜•์˜ ํŽธํ–ฅ์— ๋Œ€ํ•œ ํƒ์ง€ ๋Šฅ๋ ฅ์€ ์ถ”๊ฐ€์ ์ธ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘