Sign In

AgriWorld:A World Tools Protocol Framework for Verifiable Agricultural Reasoning with Code-Executing LLM Agents

Created by
  • Haebom
Category
Empty

์ €์ž

Zhixing Zhang, Jesen Zhang, Hao Liu, Qinhan Lv, Jing Yang, Kaitong Cai, Keze Wang

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋†์—… ๋ถ„์•ผ์˜ ๋Œ€๊ทœ๋ชจ ์‹œ๊ณต๊ฐ„ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ธฐ์กด ๋ชจ๋ธ๋“ค์˜ ์–ธ์–ด ๊ธฐ๋ฐ˜ ์ถ”๋ก  ๋Šฅ๋ ฅ ๋ถ€์กฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์ฝ”๋“œ ์‹คํ–‰ ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ LLM ์—์ด์ „ํŠธ์™€ ํ†ตํ•ฉ๋œ ๋†์—… ๋„๊ตฌ ํ”„๋ ˆ์ž„์›Œํฌ์ธ AgriWorld๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋†์—… ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๋ณต์žกํ•œ ์งˆ์˜์‘๋‹ต, ์˜ˆ์ธก, ์ด์ƒ ํƒ์ง€ ๋“ฑ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, ์ œ์•ˆ๋œ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๊ธฐ์กด ๋ฐฉ์‹๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ๋†์—… ๊ด€๋ จ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
๋†์—… ๋ฐ์ดํ„ฐ์˜ ๋ณต์žก์„ฑ๊ณผ ์ด์งˆ์„ฑ์„ ๋‹ค๋ฃจ๋ฉด์„œ๋„ LLM์˜ ์–ธ์–ด ์ดํ•ด ๋ฐ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํšจ๊ณผ์ ์œผ๋กœ ๊ฒฐํ•ฉํ•  ์ˆ˜ ์žˆ๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์ฝ”๋“œ ์‹คํ–‰ ๋Šฅ๋ ฅ๊ณผ ๋ฐ˜๋ณต์ ์ธ ํ•™์Šต(execute-observe-refine)์„ ํ†ตํ•ด ๋†์—… ๊ณผํ•™ ๋ถ„์•ผ์˜ ์‹ค์งˆ์ ์ธ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ LLM ์—์ด์ „ํŠธ์˜ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
โ€ข
AgroBench๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹์„ ํ†ตํ•ด ๋†์—… QA ์—ฐ๊ตฌ๋ฅผ ์ด‰์ง„ํ•˜๊ณ , ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์—์ด์ „ํŠธ ์„ฑ๋Šฅ ํ‰๊ฐ€๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
ํ˜„์žฌ ์—ฐ๊ตฌ๋Š” ํŠน์ • ๋†์—… QA ์ž‘์—…์— ์ง‘์ค‘๋˜์–ด ์žˆ์œผ๋ฉฐ, ๋‹ค์–‘ํ•œ ๋†์—… ์ž‘์—… ์ „๋ฐ˜์— ๊ฑธ์นœ ํฌ๊ด„์ ์ธ ์—์ด์ „ํŠธ์˜ ์ ์šฉ ๋ฐ ๊ฒ€์ฆ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘