Daily Arxiv

์ „ ์„ธ๊ณ„์—์„œ ๋ฐœ๊ฐ„๋˜๋Š” ์ธ๊ณต์ง€๋Šฅ ๊ด€๋ จ ๋…ผ๋ฌธ์„ ์ •๋ฆฌํ•˜๋Š” ํŽ˜์ด์ง€ ์ž…๋‹ˆ๋‹ค.
๋ณธ ํŽ˜์ด์ง€๋Š” Google Gemini๋ฅผ ํ™œ์šฉํ•ด ์š”์•ฝ ์ •๋ฆฌํ•˜๋ฉฐ, ๋น„์˜๋ฆฌ๋กœ ์šด์˜ ๋ฉ๋‹ˆ๋‹ค.
๋…ผ๋ฌธ์— ๋Œ€ํ•œ ์ €์ž‘๊ถŒ์€ ์ €์ž ๋ฐ ํ•ด๋‹น ๊ธฐ๊ด€์— ์žˆ์œผ๋ฉฐ, ๊ณต์œ  ์‹œ ์ถœ์ฒ˜๋งŒ ๋ช…๊ธฐํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค.

ToolMind Technical Report: A Large-Scale, Reasoning-Enhanced Tool-Use Dataset

Created by
  • Haebom
Category
Empty

์ €์ž

Chen Yang, Ran Le, Yun Xing, Zhenwei An, Zongchao Chen, Wayne Xin Zhao, Yang Song, Tao Zhang

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ์—ฐ๊ตฌ๋Š” LLM ์—์ด์ „ํŠธ์˜ ๋„๊ตฌ ์‚ฌ์šฉ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๋Œ€๊ทœ๋ชจ, ๊ณ ํ’ˆ์งˆ์˜ ์ถ”๋ก  ๊ฐ•ํ™” ๋„๊ตฌ ์‚ฌ์šฉ ๋ฐ์ดํ„ฐ์…‹์ธ ToolMind๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ToolMind๋Š” 20,000๊ฐœ ์ด์ƒ์˜ ๋„๊ตฌ์™€ 200,000๊ฐœ ์ด์ƒ์˜ ์ฆ๊ฐ•๋œ ์˜คํ”ˆ ์†Œ์Šค ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ 160,000๊ฐœ์˜ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๊ณ , ํ„ด ๋ ˆ๋ฒจ ์˜ค๋ฅ˜๋ฅผ ์ œ๊ฑฐํ•˜๊ธฐ ์œ„ํ•ด ์„ธ๋ถ„ํ™”๋œ ํ•„ํ„ฐ๋ง์„ ์ ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ToolMind๋ฅผ ํ†ตํ•ด ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์€ ๊ธฐ์กด์˜ ๋ฒ ์ด์Šค๋ผ์ธ ๋ชจ๋ธ๋ณด๋‹ค ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ์—์„œ ์œ ์˜๋ฏธํ•œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
ToolMind๋Š” ํ„ด ๋ ˆ๋ฒจ ์˜ค๋ฅ˜๋ฅผ ์ œ๊ฑฐํ•จ์œผ๋กœ์จ ํ•™์Šต ๊ณผ์ •์—์„œ ์˜ค๋ฅ˜ ์ฆํญ์„ ์™„ํ™”ํ•˜๊ณ , ๊ฒฌ๊ณ ํ•œ ๋„๊ตฌ ์‚ฌ์šฉ ํ•™์Šต์— ํ•„์ˆ˜์ ์ธ ์ž๊ธฐ ๊ต์ • ์ถ”๋ก  ์‹ ํ˜ธ๋ฅผ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋ฐ์ดํ„ฐ์…‹์˜ ๊ทœ๋ชจ์™€ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚ด์œผ๋กœ์จ LLM ์—์ด์ „ํŠธ์˜ ๋„๊ตฌ ์‚ฌ์šฉ ๋Šฅ๋ ฅ์„ ํšจ๊ณผ์ ์œผ๋กœ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.
โ€ข
๋ฐ์ดํ„ฐ ์ƒ์„ฑ ๊ณผ์ •์ด ํ•ฉ์„ฑ ๊ธฐ๋ฐ˜์ด๋ฏ€๋กœ, ์‹ค์ œ ํ™˜๊ฒฝ์˜ ๋ณต์žก์„ฑ์„ ์™„์ „ํžˆ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ–ฅํ›„์—๋Š” ์‹ค์ œ ๋ฐ์ดํ„ฐ์™€์˜ ํ†ตํ•ฉ์„ ํ†ตํ•ด ์„ฑ๋Šฅ์„ ๋”์šฑ ํ–ฅ์ƒ์‹œํ‚ฌ ํ•„์š”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘