Sign In

Limited Linguistic Diversity in Embodied AI Datasets

Created by
  • Haebom
Category
Empty

μ €μž

Selma Wanna, Agnes Luhtaru, Jonathan Salfity, Ryan Barron, Juston Moore, Cynthia Matuszek, Mitch Pryor

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” Vision-Language-Action (VLA) λͺ¨λΈ ν•™μŠ΅ 및 평가에 μ‚¬μš©λ˜λŠ” λ°μ΄ν„°μ…‹μ˜ 언어적 닀양성을 μ²΄κ³„μ μœΌλ‘œ λΆ„μ„ν•©λ‹ˆλ‹€. 연ꡬ κ²°κ³Ό, λ§Žμ€ VLA 데이터셋이 반볡적이고 ν…œν”Œλ¦Ών™”λœ λͺ…령어에 μ˜μ‘΄ν•˜λ©° ꡬ쑰적 λ³€ν˜•μ΄ μ œν•œμ μž„μ„ λ°œκ²¬ν–ˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ΄ ν•™μŠ΅ν•˜λŠ” μ–Έμ–΄ μ‹ ν˜Έμ˜ λ²”μœ„λ₯Ό μ’νžˆλŠ” κ²°κ³Όλ₯Ό μ΄ˆλž˜ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
ν˜„μž¬ VLA ν•™μŠ΅ 및 평가 λ°μ΄ν„°μ…‹μ—μ„œ μ‚¬μš©λ˜λŠ” μ–Έμ–΄ μ‹ ν˜Έμ— λŒ€ν•œ μ€‘μš”ν•œ 기술적 λ¬Έμ„œλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
데이터셋 선택, 보고, κ°œμ„ μ„ μœ„ν•œ 보닀 원칙적인 μ ‘κ·Ό 방식 λ§ˆλ ¨μ— κΈ°μ—¬ν•©λ‹ˆλ‹€.
β€’
더 넓은 언어적 λ²”μœ„λ₯Ό ν¬ν•¨ν•˜λ„λ‘ 데이터셋을 νλ ˆμ΄μ…˜ν•˜κ±°λ‚˜ ν™•μž₯ν•˜λŠ” μ „λž΅ κ°œλ°œμ„ μ§€μ›ν•©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬μ˜ ν•œκ³„μ μ€ 뢄석이 νŠΉμ • 데이터셋에 κ΅­ν•œλœλ‹€λŠ” 점이며, ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” 더 λ‹€μ–‘ν•œ 데이터셋을 ν¬ν•¨ν•˜κ³  λͺ…λ Ήμ–΄μ˜ 의미적 λ‰˜μ•™μŠ€μ— λŒ€ν•œ 더 깊이 μžˆλŠ” 뢄석이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘