Sign In

When Agents Overtrust Environmental Evidence: An Extensible Agentic Framework for Benchmarking Evidence-Grounding Defects in LLM Agents

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Strick Sheng, Ziyue Wang, Liyi Zhou

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ LLM ์—์ด์ „ํŠธ๊ฐ€ ํŒŒ์ผ, ์›น ํŽ˜์ด์ง€, API ๋“ฑ์˜ ํ™˜๊ฒฝ ์ •๋ณด๋ฅผ ์‹ ๋ขฐํ•˜๋Š” ์ •๋„๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ์ธ EnvTrustBench๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ๊ฐ€ ์—์ด์ „ํŠธ์˜ ์ „๋ฐ˜์ ์ธ ๊ธฐ๋Šฅ์ด๋‚˜ ํŠน์ • ๊ณต๊ฒฉ์— ์ง‘์ค‘ํ•˜๋Š” ๋ฐ˜๋ฉด, ๋ณธ ์—ฐ๊ตฌ๋Š” ๋ถ€์ •ํ™•ํ•˜๊ฑฐ๋‚˜ ์•…์˜์ ์ธ ํ™˜๊ฒฝ ์ •๋ณด์— ๋Œ€ํ•œ ์—์ด์ „ํŠธ์˜ ๊ณผ์‹ ์œผ๋กœ ๋ฐœ์ƒํ•˜๋Š” "์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ฒฐํ•จ(EGD)"์ด๋ผ๋Š” ๊ทผ๋ณธ์ ์ธ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด LLM ์—์ด์ „ํŠธ์˜ ํ™˜๊ฒฝ ์ •๋ณด ์ฒ˜๋ฆฌ ๊ณผ์ •์—์„œ์˜ ์ทจ์•ฝ์ ์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
LLM ์—์ด์ „ํŠธ๊ฐ€ ํ™˜๊ฒฝ ์ •๋ณด์— ๊ณผ๋„ํ•˜๊ฒŒ ์˜์กดํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๊ฒฐํ•จ(EGD)์€ ์‹ค์ œ ์šด์˜ ํ™˜๊ฒฝ์—์„œ ์ผ๊ด€๋˜๊ฒŒ ๋‚˜ํƒ€๋‚˜๋Š” ํ•ต์‹ฌ์ ์ธ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค.
โ€ข
ํ™˜๊ฒฝ ์ •๋ณด์˜ ๋ถˆํ™•์‹ค์„ฑ์€ LLM ์—์ด์ „ํŠธ์˜ ๋ณด์•ˆ์— ์ค‘์š”ํ•œ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด์— ๋Œ€ํ•œ ์ฒด๊ณ„์ ์ธ ํ‰๊ฐ€์™€ ๊ฐœ์„ ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
EnvTrustBench๋Š” ๋‹ค์–‘ํ•œ LLM ๋ฐฑ๋ณธ๊ณผ ์Šค์บํด๋“œ์— ๊ฑธ์ณ EGD๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” extensibleํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ๊ณตํ•˜์ง€๋งŒ, ์‹ค์ œ ๋ณต์žกํ•˜๊ณ  ๋™์ ์ธ ํ™˜๊ฒฝ์—์„œ์˜ ๋ชจ๋“  ์ž ์žฌ์  ์˜ค๋ฅ˜ ๋ชจ๋“œ๋ฅผ ์™„๋ฒฝํ•˜๊ฒŒ ํฌ์ฐฉํ•˜๊ธฐ๋Š” ์–ด๋ ค์šธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘