Sign In

Absurd World: A Simple Yet Powerful Method to Absurdify the Real-world for Probing LLM Reasoning Capabilities

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Ryan Albright, Golam Md Muktadir, Zarif Ikram, S M Jubaer, Mehrab Hossain, Dianbo Liu

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ๋…ผ๋ฆฌ์  ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ํ˜„์‹ค ์„ธ๊ณ„๋ฅผ ๋…ผ๋ฆฌ์ ์œผ๋กœ๋Š” ์ผ๊ด€๋˜์ง€๋งŒ ์ธ๊ฐ„์—๊ฒŒ๋Š” ์‰ฝ๊ฒŒ ํ•ด๊ฒฐ ๊ฐ€๋Šฅํ•œ '๋ถ€์กฐ๋ฆฌํ•œ ์„ธ๊ณ„'๋กœ ๋ณ€ํ˜•ํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํ‚น ํ”„๋ ˆ์ž„์›Œํฌ์ธ 'Absurd World'๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ํ˜„์‹ค ์„ธ๊ณ„์˜ ๊ตฌ์„ฑ ์š”์†Œ๋ฅผ ์ƒ์ง•, ํ–‰๋™, ์‹œํ€€์Šค, ์ด๋ฒคํŠธ๋กœ ๋ถ„ํ•ดํ•˜์—ฌ ์ž๋™ํ™”๋œ ๋ฐฉ์‹์œผ๋กœ ๋ณ€ํ˜•ํ•˜๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด LLM์ด ์‹ค์ œ ์„ธ๊ณ„์—์„œ ํ•™์Šตํ•œ ํŒจํ„ด์— ์˜ํ–ฅ์„ ๋ฐ›์ง€ ์•Š๊ณ  ๋…ผ๋ฆฌ์  ์‚ฌ๊ณ  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์–‘ํ•œ LLM ๋ชจ๋ธ์— ๋Œ€ํ•ด ๊ฐ„๋‹จํ•˜๊ณ  ๊ณ ๊ธ‰ ํ”„๋กฌํ”„ํŠธ ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ํ‰๊ฐ€๋ฅผ ์ˆ˜ํ–‰ํ•œ ๊ฒฐ๊ณผ, Absurd World๋Š” LLM์˜ ๋…ผ๋ฆฌ์  ์‚ฌ๊ณ  ๋Šฅ๋ ฅ์„ ํŒŒ์•…ํ•˜๋Š” ํšจ๊ณผ์ ์ธ ๋„๊ตฌ์ž„์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
LLM์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๊ฐ„๋‹จํ•œ ๋…ผ๋ฆฌ์  ์˜ค๋ฅ˜์—๋„ ์ทจ์•ฝํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ๋ฉฐ, ์‹ค์ œ ์„ธ๊ณ„์— ๋Œ€ํ•œ ํ•™์Šต ํŒจํ„ด์ด ์ถ”๋ก ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ํƒ๊ตฌํ•  ์ˆ˜ ์žˆ๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
โ€ข
LLM์ด ํ˜„์‹ค ์„ธ๊ณ„์˜ ๋งฅ๋ฝ์— ๊ด€๊ณ„์—†์ด ๋…ผ๋ฆฌ์  ์ผ๊ด€์„ฑ์„ ์œ ์ง€ํ•˜๋ฉฐ ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์ฒด๊ณ„์ ์œผ๋กœ ๊ฒ€์ฆํ•  ์ˆ˜ ์žˆ๋Š” ํšจ๊ณผ์ ์ธ ๋ฒค์น˜๋งˆํ‚น ๋„๊ตฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
โ€ข
'๋ถ€์กฐ๋ฆฌํ•œ ์„ธ๊ณ„'์˜ ์ƒ์„ฑ ๋ฐฉ๋ฒ•์ด ์–ผ๋งˆ๋‚˜ ๋‹ค์–‘ํ™”๋  ์ˆ˜ ์žˆ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ์ด๋Ÿฌํ•œ ๋ณ€ํ˜•์ด LLM ์ถ”๋ก  ๋Šฅ๋ ฅ ํ‰๊ฐ€์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์— ๋Œ€ํ•œ ์ถ”๊ฐ€์ ์ธ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘