haebom
Sign In
Understanding LLM Evaluator Behavior: A Structured Multi-Evaluator Framework for Merchant Risk Assessment
Created by
Haebom
Category
Empty
μ μ
Liang Wang, Junpeng Wang, Chin-chia Michael Yeh, Yan Zheng, Jiarui Sun, Xiran Fan, Xin Dai, Yujie Fan, Yiwei Cai
π‘ κ°μ
λ³Έ μ°κ΅¬λ μμΈ μ μ© μν νκ° λΆμΌμμ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM) νκ°μμ νλμ μ΄ν΄νκΈ° μν ꡬ쑰νλ λ€μ€ νκ°μ νλ μμν¬λ₯Ό μ μν©λλ€. 5κ°μ§ κΈ°μ€ λ£¨λΈλ¦κ³Ό λͺ¬ν μΉ΄λ₯Όλ‘ μ μ 체κ³λ₯Ό κ²°ν©νμ¬ LLMμ μΆλ‘ νμ§κ³Ό νκ°μ μμ μ±μ νκ°νλ©°, μ΅λͺ ν 쑰건μμ νκ°μ νΈν₯μ΄ μ€μ΄λλ κ²μ λ°κ²¬νμ΅λλ€. μΈκ° μ λ¬Έκ°μμ λΉκ΅ λ° μ€μ κΈμ΅ λ°μ΄ν°λ₯Ό ν΅ν κ²μ¦ κ²°κ³Ό, LLM νκ°μκ° μΈκ°λ³΄λ€ λμ μ μλ₯Ό λΆμ¬νμ§λ§, μΌλΆ LLMμ μΈκ° νλ¨κ³Ό λ μ μ¬ν νΈν₯μ 보μ΄λ κ²μΌλ‘ λνλ¬μ΅λλ€.
π μμ¬μ λ° νκ³
β’
LLMμ κΈμ΅ μν νκ°μ κ°μ λ―Όκ°ν λΆμΌμ νκ°μλ‘ μ¬μ©ν κ²½μ°, λͺ¨λΈλ³ κ³ μ ν νΈν₯μ±μ μ΄ν΄νκ³ μ΄λ₯Ό 보μ νλ κ²μ΄ νμμ μ λλ€.
β’
νκ° κ³Όμ μμ μ΅λͺ νλ LLM νκ°μμ νΈν₯μ±μ μννλ λ° ν¨κ³Όμ μΌ μ μμΌλ©°, μ΄λ λͺ¨λΈ μ΄μ μ κ³ λ €ν΄μΌ ν μ€μν μμμ λλ€.
β’
λ³Έ μ°κ΅¬μμ μ μλ νλ μμν¬λ LLM κΈ°λ° νκ° μμ€ν μ μ λ’°μ±μ λμ΄λ λ° κΈ°μ¬νμ§λ§, λ€μν κΈμ΅ μν λ° λ³΅μ‘ν μν μλ리μ€μ λν μ μ©μ± κ²μ¦ λ° μ§μμ μΈ λͺ¨λΈμ μ λ°μ΄νΈμ λ°λ₯Έ νκ° λ°©λ²λ‘ μ μ‘°μ μ΄ νμν©λλ€.
PDF 보기
Made with Slashpage