haebom
Sign In
StereoTales: A Multilingual Framework for Open-Ended Stereotype Discovery in LLMs
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Pierre Le Jeune,
Etienne Duchesne, Weixuan Xiao, Stefano Palminteri, Bazire Houssin, Beno
it Mal
ezieux, Matteo Dora
π‘ κ°μ
κΈ°μ‘΄μ μμ΄ μ€μ¬μ μΈ μμ νΈν₯ μ°κ΅¬μ νκ³λ₯Ό 극볡νκ³ μ, λ³Έ μ°κ΅¬λ 10κ° μΈμ΄μ 79κ°μ μ¬ν μΈκ΅¬νμ μμ±μ μμ°λ₯΄λ λ€κ΅μ΄ λ°μ΄ν°μ λ° νκ° νμ΄νλΌμΈμΈ StereoTalesλ₯Ό μ μν©λλ€. 650λ§ κ° μ΄μμ LLM μμ± μ€ν 리λ₯Ό λΆμνμ¬ 1,500κ° μ΄μμ κ³Όλ λνλ μ°κ΄μ±μ λ°κ²¬νκ³ , μΈκ° λ° LLM νκ°λ₯Ό ν΅ν΄ μ ν΄μ±μ μΈ‘μ νμ΅λλ€. λͺ¨λ νκ°λ LLMμ΄ κ·λͺ¨λ μ±λ₯μ κ΄κ³μμ΄ κ°λ°©ν μμ±μμ μ ν΄ν κ³ μ κ΄λ μ μμ±νλ©°, μ΄λ μ 곡μ 체 κ°μ 곡μ λλ κ²½ν₯μ΄ μμμ λ°νμ΅λλ€.
π μμ¬μ λ° νκ³
β’
LLMμ μΈμ΄μ λ¬Ένμ λ°λΌ λ€λ₯΄κ² νΈν₯λλ©°, νΉμ μ§μμ λ³΄νΈ λμ μ§λ¨μ λν νΈκ²¬μ μ¦νμν€λ κ²½ν₯μ΄ μμ΅λλ€.
β’
μΈκ°κ³Ό LLMμ μ ν΄μ± νλ¨μ μ λ°μ μΌλ‘ μΌμΉνμ§λ§, νΉμ μμ± κ³μΈ΅μμ λΆμΌμΉκ° λ°μν μ μμ΅λλ€.
β’
λ³Έ μ°κ΅¬λ LLMμ κ°λ°©ν μμ±μμ λνλλ μμ νΈκ²¬μ 체κ³μ μΌλ‘ νꡬνκ³ μΈ‘μ ν μ μλ μ€μν κΈ°λ°μ μ 곡ν©λλ€.
β’
ν₯ν κ³Όμ λ‘λ LLM νΈκ²¬ μνλ₯Ό μν ν¨κ³Όμ μΈ μ λ΅ κ°λ° λ° λμ± λ€μν μΈμ΄μ λ¬ΈνκΆμμμ ν¬κ΄μ μΈ μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage