haebom
Sign In
TokUR: Token-Level Uncertainty Estimation for Large Language Model Reasoning
Created by
Haebom
Category
Empty
μ μ
Tunyu Zhang, Haizhou Shi, Yibin Wang, Hengyi Wang, Xiaoxiao He, Zhuowei Li, Haoxian Chen, Ligong Han, Kai Xu, Huan Zhang, Dimitris Metaxas, Hao Wang
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ μΆλ‘ κ³Όμ μμ λ΅λ³μ μ λ’°μ±μ νκ°νκ³ κ°μ νκΈ° μν "TokUR"μ΄λΌλ ν ν° μμ€ λΆνμ€μ± μΆμ νλ μμν¬λ₯Ό μ μνλ€. LLM λμ½λ© κ³Όμ μ μ λν¬ λλ€ κ°μ€μΉ μλμ λμ νμ¬ ν ν° μμ€μ λΆνμ€μ±μ μΈ‘μ νκ³ , μ΄λ₯Ό μ§κ³νμ¬ μλ΅μ μλ―Έλ‘ μ λΆνμ€μ±μ νμ νλ€. μ€ν κ²°κ³Ό, TokURλ μ λ΅μ μ νμ± λ° λͺ¨λΈ κ²¬κ³ μ±κ³Ό λμ μκ΄κ΄κ³λ₯Ό 보μ΄λ©°, μ΄λ₯Ό νμ©νμ¬ λͺ¨λΈμ μΆλ‘ μ±λ₯μ ν₯μμν¬ μ μμμ μ μ¦νμλ€.
π μμ¬μ λ° νκ³
β’
LLMμ 볡μ‘ν λ€λ¨κ³ μΆλ‘ κ³Όμ μμ μμ±λ μλ΅μ μ λ’°μ±μ κ°κ΄μ μΌλ‘ νκ°ν μ μλ λ°©λ²λ‘ μ μ μνμλ€.
β’
μμ±λ λΆνμ€μ± μ νΈλ ν μ€νΈ μμ μμ λͺ¨λΈμ μΆλ‘ μ±λ₯μ ν₯μμν€λ λ° ν¨κ³Όμ μΌλ‘ νμ©λ μ μλ€.
β’
μ μλ λ°©λ²λ‘ μ μνμ μΆλ‘ κ³Ό κ°μ΄ μ λ΅μ΄ λͺ νν λΆμΌμμ LLMμ μ λ’°μ±κ³Ό ν΄μ κ°λ₯μ±μ λμ΄λ λ° κΈ°μ¬ν μ μλ€.
β’
ν₯ν μ°κ΅¬μμλ λ λ€μν μ’ λ₯μ μΆλ‘ μμ λ° LLM μν€ν μ²μ λν TokURμ μΌλ°ν κ°λ₯μ±μ νμν΄μΌ νλ€.
PDF 보기
Made with Slashpage