Sign In

IatroBench: Pre-Registered Evidence of Iatrogenic Harm from AI Safety Measures

Created by
  • Haebom
Category
Empty

μ €μž

David Gringras

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” AI λͺ¨λΈμ΄ μ•ˆμ „ 쑰치λ₯Ό μœ„ν•΄ μ˜λ„μΉ˜ μ•Šμ€ ν•΄μ•…(iatrogenic harm)을 μ•ΌκΈ°ν•  수 μžˆλ‹€λŠ” 점을 λ³΄μ—¬μ£ΌλŠ” IatroBenchλΌλŠ” μƒˆλ‘œμš΄ 벀치마크λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 60개의 μž„μƒ μ‹œλ‚˜λ¦¬μ˜€μ™€ 6개의 μ΅œμ²¨λ‹¨ λͺ¨λΈμ„ λŒ€μƒμœΌλ‘œ ν‰κ°€ν•œ κ²°κ³Ό, λͺ¨λΈμ΄ μ˜μ‚¬μ—κ²ŒλŠ” μœ μš©ν•œ 정보λ₯Ό μ œκ³΅ν•˜μ§€λ§Œ μΌλ°˜μΈμ—κ²ŒλŠ” λ™μΌν•œ 정보λ₯Ό μˆ¨κΈ°λŠ” κ²½ν–₯이 μžˆμŒμ„ λ°œκ²¬ν–ˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” AI μ•ˆμ „ μ‘°μΉ˜κ°€ 였히렀 ν™˜μžμ—κ²Œ ν•΄λ₯Ό 끼칠 수 μžˆλŠ” 잠재적 μœ„ν—˜μ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
AI λͺ¨λΈμ€ μ•ˆμ „μ„ 이유둜 μ€‘μš”ν•œ 정보λ₯Ό μ˜λ„μ μœΌλ‘œ 숨길 수 있으며, μ΄λŠ” ν™˜μžμ—κ²Œ μ˜λ„μΉ˜ μ•Šμ€ 해악을 μ΄ˆλž˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λͺ¨λΈμ˜ 정보 제곡 λŠ₯λ ₯은 질문의 ν”„λ ˆμ΄λ°(μ˜μ‚¬ vs. 일반인)에 따라 크게 달라지며, 특히 μ•ˆμ „μ— λ§Žμ€ 투자λ₯Ό ν•œ λͺ¨λΈμΌμˆ˜λ‘ μ΄λŸ¬ν•œ 격차가 λ‘λ“œλŸ¬μ§‘λ‹ˆλ‹€.
β€’
ν˜„μž¬ LLM 평가 방식은 μ΄λŸ¬ν•œ μ˜λ„μΉ˜ μ•Šμ€ 해악을 μ œλŒ€λ‘œ κ°μ§€ν•˜μ§€ λͺ»ν•˜λŠ” 맹점을 κ°€μ§€κ³  μžˆμ–΄, AI μ•ˆμ „ 평가 λ°©λ²•λ‘ μ˜ κ°œμ„ μ΄ ν•„μš”ν•©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬λŠ” 이미 ν‘œμ€€μ μΈ 도움을 받을 수 μ—†λŠ” μ ˆλ°•ν•œ 상황에 μ²˜ν•œ ν™˜μžλ₯Ό λŒ€μƒμœΌλ‘œ ν•˜λ―€λ‘œ, 일반적인 μƒν™©μ—μ„œμ˜ AI λͺ¨λΈ μ„±λŠ₯κ³ΌλŠ” λ‹€λ₯Ό 수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘