haebom
Sign In
CLR-voyance: Reinforcing Open-Ended Reasoning for Inpatient Clinical Decision Support with Outcome-Aware Rubrics
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Aishik Nagar, Arun-Kumar Kaliya-Perumal, Yu-Hsuan Han, Andrew Sheng-Han Huang, Kristen Kee, Yushi Cao, Yiming Chen, Hongchao Jiang
π‘ κ°μ
λ³Έ μ°κ΅¬λ νμ μ§λ£μ κ°μ λΆνμ€ν μν©μμμ μμ μΆλ‘ μ μν μλ‘μ΄ νλ μμν¬μΈ CLR-voyanceλ₯Ό μ μν©λλ€. CLR-voyanceλ νμμ μΉλ£ μ¬μ μ λΆλΆμ μΌλ‘λ§ κ΄μ°° κ°λ₯ν λ§λ₯΄μ½ν κ²°μ κ³Όμ (POMDP)μΌλ‘ μ¬μ μνκ³ , νμμ μ΅μ’ κ²°κ³Όμ μμμ κ²μ¦μ λͺ¨λ λ°μνλ 보μ μμ€ν μ λμ ν©λλ€. μ΄λ₯Ό ν΅ν΄ κΈ°μ‘΄μ νκ° λ°©μμ΄ κ°μ§ νκ³λ₯Ό 극볡νκ³ , μμ μΆλ‘ λ₯λ ₯μ΄ ν₯μλ AI λͺ¨λΈ κ°λ° λ° νκ°λ₯Ό κ°λ₯νκ² ν©λλ€.
π μμ¬μ λ° νκ³
β’
μλ―Έ μλ μμ μΆλ‘ λ₯λ ₯ ν₯μ:
CLR-voyance νλ μμν¬λ λ¨μν μ 보λ₯Ό κ²μνλ κ²μ λμ΄, μμμ λ§₯λ½κ³Ό νμμ λ―Έλ κ²°κ³Όλ₯Ό κ³ λ €νλ AI λͺ¨λΈμ μΆλ‘ λ₯λ ₯μ ν₯μμν¬ μ μμ΅λλ€.
β’
κ°κ΄μ μ΄κ³ μμμ κ²μ¦λ νκ°:
νμμ μ΅μ’ κ²°κ³Όμ μμμ μ§μ μ μΈ νΌλλ°±μ ν΅ν©ν 보μ μμ€ν μ AI λͺ¨λΈμ μμ μΆλ‘ λ₯λ ₯μ λ³΄λ€ κ°κ΄μ μ΄κ³ μ λ’°μ± μκ² νκ°ν μ μλ κΈ°λ°μ μ 곡ν©λλ€.
β’
νμ¬ μμ μΆλ‘ νκ° λ°©μμ κ°μ :
λ³Έ μ°κ΅¬μμ μ μλ CLR-voyanceλ κΈ°μ‘΄μ LLM κΈ°λ° νκ° λ°©μμ΄λ λ¨μ‘°λ‘μ΄ RL 보μ μ νΈμ νκ³λ₯Ό λͺ νν μ§μ νλ©°, μ΄λ₯Ό κ°μ ν μ μλ ꡬ체μ μΈ λ°©λ²μ μ μν©λλ€.
β’
μ λμ μ±λ₯ ν₯μ:
CLR-voyanceλ₯Ό μ μ©ν λͺ¨λΈμ κΈ°μ‘΄μ μ΅κ³ μμ€ μλ£ μΆλ‘ λͺ¨λΈλ³΄λ€ λ°μ΄λ μ±λ₯μ 보μ¬μ£ΌμμΌλ©°, μΌλ°μ μΈ μλ£ λ²€μΉλ§ν¬μμλ μ°μν κ²°κ³Όλ₯Ό 보μμ΅λλ€.
β’
μλ£ νμ₯ μ μ© κ°λ₯μ±:
6κ°μ μ΄μ μ€μ λ³μμμ λ°°ν¬λμ΄ μμ² κ±΄μ μμ¬ κ²°μ μ μ§μνλ©° κ·Έ ν¨κ³Όλ₯Ό μ μ¦νμ΅λλ€.
β’
μΈκ³΅μ§λ₯μ 'νμ¬' μν μ λν ν΅μ°°:
λκ·λͺ¨ μμμ κ²μ¦ μ°κ΅¬λ₯Ό ν΅ν΄ AIκ° 'νμ¬' μν μ μνν λ λ°μνλ λ¬Έμ μ κ³Ό λͺ¨λΈ μ νμ λν μ€μν ν΅μ°°μ μ 곡ν©λλ€.
β’
κ³Όλν μ»΄ν¨ν μμ μꡬ κ°λ₯μ±:
POMDP λͺ¨λΈλ§ λ° μμ κ²°κ³Ό κΈ°λ°μ 볡μ‘ν 보μ μμ€ν μ μλΉν μ»΄ν¨ν μμμ μꡬν μ μμΌλ©°, μ΄λ μ€μκ° μ μ©μ΄λ μ μ¬μ νκ²½μμμ νμ©μ μ μ½μ΄ λ μ μμ΅λλ€.
β’
μμμ κ²μ¦μ λν μκ° λ° λΉμ© μλͺ¨:
λκ·λͺ¨ μμ κ²μ¦ μ°κ΅¬λ λ§μ μμμ μκ°κ³Ό λ Έλ ₯μ νμλ‘ νλ―λ‘, μ€μ μ μ© κ³Όμ μμ μΆκ°μ μΈ λΉμ©κ³Ό μκ°μ΄ μμλ μ μμ΅λλ€.
β’
λͺ¨λΈ ν΄μ κ°λ₯μ±:
CLR-voyanceλ₯Ό ν΅ν΄ νμ΅λ λͺ¨λΈμ΄ μ΄λ»κ² μ΅μ’ κ²°μ μ λ΄λ¦¬λμ§μ λν ν΄μ κ°λ₯μ±μ λμ΄λ μ°κ΅¬κ° μΆκ°μ μΌλ‘ νμν©λλ€.
PDF 보기
Made with Slashpage