Sign In

TaskGround: Structured Executable Task Inference for Full-Scene Household Reasoning

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

ZhiYuan Feng, Yu Deng, Ruichuan An, Zhenhua Liu, Qixiu Li, Keming Wu, Zhiying Du, Weijie Wang, Haoxiao Wang, Shuang Chen, Sicheng Xu, Yaobo Liang, Jiaolong Yang, Baining Guo

πŸ’‘ κ°œμš”

이 논문은 λ‘œλ΄‡ μ—μ΄μ „νŠΈκ°€ μ‹€μ œ κ°€μ • ν™˜κ²½μ—μ„œ λ³΅μž‘ν•˜κ³  λΆˆμ™„μ „ν•œ μ§€μ‹œλ₯Ό μ΄ν•΄ν•˜κ³  μ‹€ν–‰ν•˜κΈ° μœ„ν•œ '전체 μž₯λ©΄ 가사 μΆ”λ‘ ' λŠ₯λ ₯을 μ œμ•ˆν•©λ‹ˆλ‹€. μ œμ•ˆν•˜λŠ” TaskGroundλŠ” λ°©λŒ€ν•œ 가사 μž₯λ©΄ 정보λ₯Ό 좔둠에 ν•„μš”ν•œ 핡심 μ •λ³΄λ‘œ μ••μΆ•ν•˜κ³ , μ‹€ν–‰ κ°€λŠ₯ν•œ μž‘μ—… ꡬ쑰λ₯Ό μΆ”λ‘ ν•˜λ©°, 이λ₯Ό ꡬ체적인 행동 μˆœμ„œλ‘œ λ³€ν™˜ν•˜λŠ” 3단계 ν”„λ ˆμž„μ›Œν¬μž…λ‹ˆλ‹€. 이λ₯Ό 톡해 μ œν•œλœ μ—°μ‚° λŠ₯λ ₯κ³Ό ν”„λΌμ΄λ²„μ‹œ μ œμ•½μ„ κ°€μ§„ μ†Œν˜• λͺ¨λΈλ„ λ³΅μž‘ν•œ 가사 μž‘μ—…μ„ μ„±κ³΅μ μœΌλ‘œ μˆ˜ν–‰ν•  수 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
효율적인 μž₯λ©΄ 이해: TaskGroundλŠ” κ±°λŒ€ν•œ 가사 μž₯λ©΄ 정보λ₯Ό μž‘μ—… κ΄€λ ¨ 핡심 μ •λ³΄λ‘œ μ••μΆ•ν•˜μ—¬, λΆˆν•„μš”ν•œ μ •λ³΄λ‘œ μΈν•œ 였λ₯˜λ₯Ό 쀄이고 처리 νš¨μœ¨μ„±μ„ λ†’μž…λ‹ˆλ‹€.
β€’
μ†Œν˜• λͺ¨λΈμ˜ μ„±λŠ₯ ν–₯상: λ³Έ ν”„λ ˆμž„μ›Œν¬λŠ” Qwen3.5-9B와 같은 κ°œλ°©ν˜• μ†Œν˜• λͺ¨λΈμ΄ GPT-5와 같은 λŒ€ν˜• λͺ¨λΈμ— ν•„μ ν•˜λŠ” μ„±λŠ₯을 λ°œνœ˜ν•˜λ„λ‘ μ§€μ›ν•˜λ©°, 토큰 λΉ„μš©μ„ 획기적으둜 μ ˆκ°ν•©λ‹ˆλ‹€.
β€’
κ΅¬μ‘°ν™”λœ μž‘μ—… μΆ”λ‘ μ˜ μ€‘μš”μ„±: 논문은 μ‹€ν–‰ κ°€λŠ₯ν•œ μž‘μ—… ꡬ쑰λ₯Ό μΆ”λ‘ ν•˜λŠ” 것이 전체 μž₯λ©΄ 가사 μΆ”λ‘ μ—μ„œ 핡심적인 병λͺ© ν˜„μƒμž„μ„ κ°•μ‘°ν•˜λ©°, κ΅¬μ‘°ν™”λœ μž₯λ©΄ 정보λ₯Ό ν™œμš©ν•˜λŠ” μ ‘κ·Ό λ°©μ‹μ˜ μ€‘μš”μ„±μ„ μž…μ¦ν•©λ‹ˆλ‹€.
β€’
λ°μ΄ν„°μ…‹μ˜ ν•œκ³„: μ œμ•ˆλœ FullHome 데이터셋은 400개의 μž‘μ—…μœΌλ‘œ κ΅¬μ„±λ˜μ–΄ μžˆμœΌλ‚˜, μ‹€μ œ κ°€μ • ν™˜κ²½μ˜ λ‹€μ–‘μ„±κ³Ό λ³΅μž‘μ„±μ„ μ™„μ „νžˆ ν¬κ΄„ν•˜κΈ°μ—λŠ” 아직 λΆ€μ‘±ν•  수 μžˆμŠ΅λ‹ˆλ‹€. ν–₯ν›„ 더 λ°©λŒ€ν•˜κ³  λ‹€μ–‘ν•œ μ‹œλ‚˜λ¦¬μ˜€λ₯Ό ν¬ν•¨ν•˜λŠ” 데이터셋 ꡬ좕이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘