Sign In

VT-Bench: A Unified Benchmark for Visual-Tabular Multi-Modal Learning

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Zi-Yi Jia, Zi-Jian Cheng, Xin-Yue Zhang, Kun-Yang Yu, Zhi Zhou, Yu-Feng Li, Lan-Zhe Guo

πŸ’‘ κ°œμš”

λ³Έ 논문은 의료, μ‚°μ—… λ“± μ€‘μš” λΆ„μ•Όμ—μ„œ ν™œμš©λ„κ°€ 높은 μ‹œκ°-ν‘œ ν˜•μ‹(visual-tabular) 데이터에 λŒ€ν•œ 닀쀑λͺ¨λ‹¬ ν•™μŠ΅μ˜ μ€‘μš”μ„±μ„ κ°•μ‘°ν•˜λ©°, 이λ₯Ό μœ„ν•œ 졜초의 톡합 벀치마크인 VT-Benchλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. VT-BenchλŠ” 9개 도메인에 걸친 14개의 데이터셋과 756,000개 μ΄μƒμ˜ μƒ˜ν”Œμ„ ν†΅ν•©ν•˜μ—¬ μ‹œκ°-ν‘œ ν˜•μ‹ λ°μ΄ν„°μ˜ νŒλ³„ 예츑 및 생성 좔둠을 ν‘œμ€€ν™”ν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ μ΅œμ‹  λͺ¨λΈλ“€μ„ ν‰κ°€ν•œ κ²°κ³Ό, μ‹œκ°-ν‘œ ν˜•μ‹ ν•™μŠ΅μ΄ μƒλ‹Ήν•œ 도전 과제λ₯Ό μ•ˆκ³  μžˆμŒμ„ 보여주며, ν–₯ν›„ κ°•λ ₯ν•œ 닀쀑λͺ¨λ‹¬ μ‹œκ°-ν‘œ ν˜•μ‹ 기반 λͺ¨λΈ κ°œλ°œμ„ 촉진할 κ²ƒμœΌλ‘œ κΈ°λŒ€λ©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ‹œκ°-ν‘œ ν˜•μ‹ 닀쀑λͺ¨λ‹¬ ν•™μŠ΅μ„ μœ„ν•œ 졜초의 포괄적인 벀치마크λ₯Ό μ œμ‹œν•˜μ—¬ ν•΄λ‹Ή λΆ„μ•Ό 연ꡬλ₯Ό μ²΄κ³„ν™”ν•˜κ³  λ°œμ „μ„ 가속화할 κ²ƒμž…λ‹ˆλ‹€.
β€’
μ˜λ£Œμ™€ 같이 κ³ λΆ€κ°€κ°€μΉ˜ λΆ„μ•Όμ—μ„œ μ‹œκ°-ν‘œ ν˜•μ‹ λͺ¨λΈμ˜ 잠재λ ₯을 νƒμƒ‰ν•˜κ³  μ‹€μ§ˆμ μΈ 적용 κ°€λŠ₯성을 λͺ¨μƒ‰ν•˜λŠ” 데 κΈ°μ—¬ν•  κ²ƒμž…λ‹ˆλ‹€.
β€’
ν˜„μž¬ λ²€μΉ˜λ§ˆν¬μ— ν¬ν•¨λœ λͺ¨λΈλ“€μ˜ μ„±λŠ₯ 격차가 크고, μ‹œκ°-ν‘œ ν˜•μ‹ ν•™μŠ΅μ˜ λ³΅μž‘μ„±μ„ κ³ λ €ν•  λ•Œ, λ”μš± μ •κ΅ν•˜κ³  νŠΉν™”λœ λͺ¨λΈ μ•„ν‚€ν…μ²˜ 및 ν•™μŠ΅ 방법둠 개발이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘