Sign In

LifeEval: A Multimodal Benchmark for Assistive AI in Egocentric Daily Life Tasks

Created by
  • Haebom
Category
Empty

μ €μž

Hengjian Gao, Kaiwei Zhang, Shibo Wang, Mingjie Chen, Qihang Cao, Xianfeng Wang, Yucheng Zhu, Xiongkuo Min, Wei Sun, Dandan Zhu, Guangtao Zhai

πŸ’‘ κ°œμš”

이 논문은 ν˜„μ‹€ μ„Έκ³„μ˜ 동적인 ν™˜κ²½μ—μ„œ μΈκ°„μ—κ²Œ 효과적인 도움을 μ œκ³΅ν•˜λŠ” λ©€ν‹°λͺ¨λ‹¬ λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(MLLM)의 λŠ₯λ ₯을 ν‰κ°€ν•˜κΈ° μœ„ν•œ μƒˆλ‘œμš΄ 벀치마크인 LifeEval을 μ œμ•ˆν•©λ‹ˆλ‹€. LifeEval은 μ‹€μ‹œκ°„, 과제 μ§€ν–₯적인 인간-AI ν˜‘μ—…μ„ μΌμƒμƒν™œμ—μ„œ μ‚¬μš©μž μ‹œμ (egocentric)으둜 ν‰κ°€ν•˜λ©°, 6κ°€μ§€ 핡심 μ—­λŸ‰ 차원에 걸쳐 4,075개의 μ§ˆμ˜μ‘λ‹΅ 쌍으둜 κ΅¬μ„±λ©λ‹ˆλ‹€. 26개의 μ΅œμ‹  MLLM에 λŒ€ν•œ ν‰κ°€λŠ” μ‹œκΈ°μ μ ˆν•˜κ³  효과적이며 적응적인 μƒν˜Έμž‘μš© 달성에 μƒλ‹Ήν•œ 어렀움이 μžˆμŒμ„ λ³΄μ—¬μ€λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κΈ°μ‘΄ λΉ„λ””μ˜€ λ²€μΉ˜λ§ˆν¬κ°€ 주둜 μˆ˜λ™μ  μ΄ν•΄λ‚˜ κ°œλ³„ 인지 κ³Όμ œμ— μ΄ˆμ μ„ 맞좘 반면, LifeEval은 μ‹€μ‹œκ°„ μ‚¬μš©μž μ§€μ›μ˜ μƒν˜Έμž‘μš©μ μ΄κ³  적응적인 νŠΉμ„±μ„ ν¬μ°©ν•©λ‹ˆλ‹€.
β€’
이 λ²€μΉ˜λ§ˆν¬λŠ” 인간 μ€‘μ‹¬μ˜ μƒν˜Έμž‘μš© μ§€λŠ₯ λ°œμ „μ„ μœ„ν•œ ν•„μˆ˜μ μΈ λ°©ν–₯을 μ œμ‹œν•˜μ—¬, AIκ°€ μ‹€μ œ μƒν™œμ—μ„œ 더 μœ μš©ν•œ μ‘°λ ₯μžκ°€ 되기 μœ„ν•œ ꡬ체적인 과제λ₯Ό λͺ…ν™•νžˆ ν•©λ‹ˆλ‹€.
β€’
아직 MLLM이 μ‹€μ‹œκ°„μœΌλ‘œ μ‹œκΈ°μ μ ˆν•˜κ³  효과적이며 적응적인 μƒν˜Έμž‘μš©μ„ λ‹¬μ„±ν•˜λŠ” 데 μƒλ‹Ήν•œ κ°œμ„ μ΄ ν•„μš”ν•˜λ‹€λŠ” 점이 λ“œλŸ¬λ‚¬μœΌλ©°, μ΄λŠ” ν–₯ν›„ 연ꡬ 개발의 μ€‘μš”ν•œ λ°©ν–₯이 될 κ²ƒμž…λ‹ˆλ‹€.
πŸ‘