haebom
Sign In
Evaluating Clinical Competencies of Large Language Models with a General Practice Benchmark
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Zheqing Li, Yiying Yang, Jiping Lang, Wenhao Jiang, Junrong Chen, Yuhang Zhao, Shuang Li, Dingqian Wang, Zhu Lin, Xuanna Li, Yuze Tang, Jiexian Qiu, Xiaolin Lu, Hongji Yu, Shuang Chen, Yuhua Bi, Xiaofei Zeng, Yixian Chen, Lin Yao
π‘ κ°μ
κΈ°μ‘΄ LLM νκ° λ°©μμ μ€μ μμ νκ²½μμμ GPs(μΌλ° μ§λ£μ) μν μν λ₯λ ₯μ μΆ©λΆν λ°μνμ§ λͺ»νλ€λ λ¬Έμ λ₯Ό μ κΈ°ν©λλ€. μ΄μ λ³Έ μ°κ΅¬λ GPsμ μμ μλμ κΈ°λ°μΌλ‘ ν μλ‘μ΄ νκ° νλ μμν¬μ λ°μ΄ν°μ (GPBench)μ μ μν©λλ€. μ΄λ₯Ό ν΅ν΄ 10κ°μ μ΅μ LLMμ νκ°ν κ²°κ³Ό, νμ¬ LLMμ GPsμ μ 무λ₯Ό μμ¨μ μΌλ‘ μννκΈ°μ λΆμ ν©νλ©° μΈκ°μ μ§μμ μΈ κ°λ κ³Ό GPsμ μΌμ μ 무μ νΉνλ μ΅μ νκ° νμν¨μ λ°νμ΅λλ€.
π μμ¬μ λ° νκ³
β’
LLMμ μμ μλ νκ°μ μμ΄ μ€μ§μ μΈ GPsμ μ 무 λ§₯λ½μ λ°μνλ μ€μμ±μ κ°μ‘°ν©λλ€.
β’
GPs μ 무μ λ§μΆ° μ λ¬Έκ°λ€μ΄ μΈμ¬νκ² κ΅¬μΆν GPBench λ°μ΄ν°μ μ LLMμ μμ μ μ© κ°λ₯μ±μ 체κ³μ μΌλ‘ νκ°νλ λ° κΈ°μ¬ν μ μμ΅λλ€.
β’
νμ¬ LLMμ GPsμ μμ μ 무λ₯Ό μμ ν λ체ν μ μμΌλ©°, μμ¨μ μΈ μμ μ μ©μ μν΄μλ μΆκ°μ μΈ μ°κ΅¬μ μΈκ°μ κ°λ μ΄ νμμ μ λλ€.
PDF 보기
Made with Slashpage