haebom
Sign In
From Answers to Arguments: Toward Trustworthy Clinical Diagnostic Reasoning with Toulmin-Guided Curriculum Goal-Conditioned Learning
Created by
Haebom
Category
Empty
์ ์
Chen Zhan, Xiaoyu Tan, Gengchen Ma, Yu-Jie Xiong, Xiaoyan Jiang, Xihe Qiu
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ์์ ์ง๋จ์์ LLM์ ๋ถํฌ๋ช ํ๊ณ ์ ๋ขฐํ ์ ์๋ ์ถ๋ก ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ํ๋ฏผ ๋ชจ๋ธ์ ํ์ฉํ ์๋ก์ด ํ๋ จ ํ๋ ์์ํฌ์ธ Curriculum Goal-Conditioned Learning (CGCL)์ ์ ์ํฉ๋๋ค. CGCL์ 3๋จ๊ณ ์ปค๋ฆฌํ๋ผ์ ํตํด LLM์ด ์ฌ์ค ์ถ์ถ, ๊ฐ์ค ๊ฒ์ฆ ๋ฐ ๋ฐ๋ฐ, ๊ฒฐ๋ก ๋์ถ ๋ฑ ํ๋ฏผ ๋ชจ๋ธ ๊ตฌ์กฐ์ ๋ฐ๋ฅธ ๋ช ํํ ์ง๋จ ๋ ผ์ฆ์ ์์ฑํ๋๋ก ์ ์ง์ ์ผ๋ก ํ๋ จํฉ๋๋ค. ์ด๋ฅผ ํตํด ๊ธฐ์กด์ ๊ณ ๋น์ฉ RL ๋ฐฉ์๊ณผ ๋๋ฑํ ์์ค์ ์ง๋จ ์ ํ๋์ ์ถ๋ก ํ์ง์ ๋ฌ์ฑํ๋ฉด์๋ ๋ ์์ ์ ์ด๊ณ ํจ์จ์ ์ธ ํ๋ จ์ด ๊ฐ๋ฅํจ์ ๋ณด์ฌ์ค๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
LLM ๊ธฐ๋ฐ ์์ ์ง๋จ ์์คํ ์ ์ ๋ขฐ์ฑ ๋ฐ ํฌ๋ช ์ฑ ํ๋ณด๋ฅผ ์ํ ์ค์ง์ ์ธ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํฉ๋๋ค.
โข
ํ๋ฏผ ๋ชจ๋ธ์ด๋ผ๋ ๊ฒ์ฆ๋ ๋ ผ์ฆ ๊ตฌ์กฐ๋ฅผ ํ์ฉํ์ฌ LLM์ ์ถ๋ก ๊ณผ์ ์ ๋ช ํํ๊ณ ์ดํด ๊ฐ๋ฅํ๊ฒ ๋ง๋ญ๋๋ค.
โข
๊ณ ๋น์ฉ์ RL ๋ฐฉ์ ๋๋น ํจ์จ์ ์ด๊ณ ์์ ์ ์ธ ํ๋ จ ํ์ดํ๋ผ์ธ์ ์ ๊ณตํฉ๋๋ค.
โข
T-Eval๊ณผ ๊ฐ์ ์ ๋์ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ ์ ๋ฐฉ๋ฒ๋ก ์ ํจ๊ณผ๋ฅผ ๊ฒ์ฆํฉ๋๋ค.
โข
์์ง ์ค์ ์์ ํ๊ฒฝ์์์ ๊ด๋ฒ์ํ ๊ฒ์ฆ ๋ฐ ์ ์ฉ์ด ํ์ํฉ๋๋ค.
โข
ํ๋ฏผ ๋ชจ๋ธ์ ๋ณต์ก์ฑ์ด LLM ํ๋ จ์ ๋ฏธ์น๋ ์ถ๊ฐ์ ์ธ ์ํฅ์ ๋ํ ์ฌ์ธต ๋ถ์์ด ํ์ํ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage