Sign In

How Well Does Agent Development Reflect Real-World Work?

Created by
  • Haebom
Category
Empty

μ €μž

Zora Zhiruo Wang, Sanidhya Vijayvargiya, Aspen Chen, Hanmo Zhang, Venu Arvind Arangarajan, Jett Chen, Valerie Chen, Diyi Yang, Daniel Fried, Graham Neubig

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” AI μ—μ΄μ „νŠΈ 개발이 μ‹€μ œ 세계 노동 μ‹œμž₯을 μ–Όλ§ˆλ‚˜ 잘 λ°˜μ˜ν•˜λŠ”μ§€ μ²΄κ³„μ μœΌλ‘œ λΆ„μ„ν•©λ‹ˆλ‹€. 43개의 λ²€μΉ˜λ§ˆν¬μ™€ 72,342개의 μž‘μ—…μ„ μ‹€μ œ λ―Έκ΅­ 노동 μ‹œμž₯의 1,016개 직업에 λ§€ν•‘ν•˜μ—¬ λΆ„μ„ν•œ κ²°κ³Ό, μ—μ΄μ „νŠΈ κ°œλ°œμ€ ν”„λ‘œκ·Έλž˜λ° μ€‘μ‹¬μ μœΌλ‘œ 치우쳐 있으며 μ‹€μ œ 인간 노동 및 경제 κ°€μΉ˜κ°€ μ§‘μ€‘λ˜λŠ” λΆ„μ•Όμ™€λŠ” μƒλ‹Ήν•œ 뢈일치λ₯Ό λ³΄μ˜€μŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ κ²°κ³Όλ₯Ό λ°”νƒ•μœΌλ‘œ, λ³Έ 논문은 μ‚¬νšŒμ μœΌλ‘œ μ€‘μš”ν•˜κ³  기술적으둜 도전적인 업무λ₯Ό 더 잘 ν¬μ°©ν•˜λŠ” 벀치마크 섀계λ₯Ό μœ„ν•œ μ„Έ κ°€μ§€ 원칙(포괄성, ν˜„μ‹€μ„±, μ„ΈλΆ„ν™”λœ 평가)을 μ œμ•ˆν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
AI μ—μ΄μ „νŠΈ κ°œλ°œμ€ ν˜„μž¬ μ‹€μ œ 노동 μ‹œμž₯μ—μ„œ κ°€μΉ˜κ°€ 높은 λΆ„μ•Όλ₯Ό μΆ©λΆ„νžˆ λ°˜μ˜ν•˜μ§€ λͺ»ν•˜κ³  있으며, ν”„λ‘œκ·Έλž˜λ° κ΄€λ ¨ μž‘μ—…μ— νŽΈμ€‘λ˜λŠ” κ²½ν–₯이 μžˆμŠ΅λ‹ˆλ‹€.
β€’
AI μ—μ΄μ „νŠΈμ˜ μ‹€μ§ˆμ μΈ νš¨μš©μ„±μ„ 높이기 μœ„ν•΄μ„œλŠ” μ‹€μ œ μž‘μ—… ν™˜κ²½μ—μ„œμ˜ μžμœ¨μ„± μˆ˜μ€€μ„ κ³ λ €ν•œ μ‹€μš©μ μΈ 지침이 ν•„μš”ν•©λ‹ˆλ‹€.
β€’
ν–₯ν›„ 벀치마크 섀계 μ‹œ, μ‹€μ œ 노동 μ‹œμž₯의 뢄포λ₯Ό 더 μ •ν™•ν•˜κ²Œ λ°˜μ˜ν•˜κ³  μ‚¬νšŒμ μœΌλ‘œ μ€‘μš”ν•œ 업무λ₯Ό 포괄할 수 μžˆλ„λ‘ 포괄성, ν˜„μ‹€μ„±, μ„ΈλΆ„ν™”λœ ν‰κ°€λΌλŠ” μ„Έ κ°€μ§€ 원칙을 κ³ λ €ν•΄μ•Ό ν•©λ‹ˆλ‹€.
πŸ‘