Sign In

The Alignment Target Problem: Divergent Moral Judgments of Humans, AI Systems, and Their Designers

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Benjamin Minhao Chen, Xinyu Xie

πŸ’‘ κ°œμš”

λ³Έ 논문은 AI μ •λ ¬ μ—°κ΅¬μ˜ 핡심 문제인 'λˆ„κ΅¬μ˜ 도덕적 κΈ°λŒ€λ₯Ό AI μ˜μ‚¬κ²°μ •μ— λ°˜μ˜ν•΄μ•Ό ν•˜λŠ”κ°€'에 λŒ€ν•œ μ§ˆλ¬Έμ„ λ˜μ§„λ‹€. κΈ°μ‘΄ 연ꡬ와 달리, 인간 ν–‰μœ„μž, AI μ‹œμŠ€ν…œ, 그리고 AI μ„€κ³„μž κ°„μ˜ 도덕적 νŒλ‹¨μ΄ μ–΄λ–»κ²Œ λ‹¬λΌμ§€λŠ”μ§€λ₯Ό μ‹€ν—˜μ„ 톡해 λΆ„μ„ν•œλ‹€. μ‹€ν—˜ κ²°κ³Ό, 인간과 λ‘œλ΄‡μ— λŒ€ν•œ ν‰κ°€λŠ” μœ μ‚¬ν–ˆμœΌλ‚˜, λ‘œλ΄‡μ˜ 행동이 인간 μ„€κ³„μ˜ 결과물둜 μ„€λͺ…될 λ•Œ μ°Έκ°€μžλ“€μ€ 훨씬 더 κ·œμΉ™ 기반의 의무둠적 좔둠을 λ³΄μ˜€μœΌλ©°, μ΄λŠ” μΈκ°„μ˜ κ°œμž…μ΄ 인지될 λ•Œ 도덕적 μ œμ•½μ΄ 강화됨을 μ‹œμ‚¬ν•œλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
AI μ‹œμŠ€ν…œμ˜ 도덕적 νŒλ‹¨ 기쀀을 μ„€μ •ν•  λ•Œ, λ‹¨μˆœν•œ μΈκ°„μ˜ 행동 λͺ¨λ°©λ§ŒμœΌλ‘œλŠ” λΆ€μ‘±ν•˜λ©° AI μ„€κ³„μžμ™€ μ‚¬μš©μž λͺ¨λ‘μ˜ 볡합적인 도덕적 κΈ°λŒ€μ™€ νŒλ‹¨ 기쀀을 κ³ λ €ν•΄μ•Ό ν•œλ‹€.
β€’
μΈκ°„μ˜ κ°œμž…μ΄ 인지될 경우, AI μ‹œμŠ€ν…œμ΄λ‚˜ κ·Έ μ„€κ³„μžμ— λŒ€ν•œ 도덕적 ν‰κ°€λŠ” λ”μš± μ—„κ²©ν•΄μ§€λ―€λ‘œ, AI 섀계 κ³Όμ •μ—μ„œ μ΄λŸ¬ν•œ '인간 μ±…μž„'에 λŒ€ν•œ 인식을 μ–΄λ–»κ²Œ λ‹€λ£°μ§€κ°€ μ€‘μš”ν•΄μ§„λ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” νŠΉμ • μ‹œλ‚˜λ¦¬μ˜€λ₯Ό 기반으둜 ν•œ μ‹€ν—˜μœΌλ‘œ, λ‹€μ–‘ν•œ 문화적 λ°°κ²½κ³Ό 상황에 λŒ€ν•œ μΌλ°˜ν™”λŠ” μΆ”κ°€ 연ꡬ가 ν•„μš”ν•˜λ‹€. λ˜ν•œ, μ°Έκ°€μžλ“€μ˜ ꡬ체적인 도덕적 μΆ”λ‘  과정을 더 깊이 탐ꡬ할 ν•„μš”κ°€ μžˆλ‹€.
πŸ‘