haebom
Sign In
Hallucination Detection-Guided Preference Optimization for Clinical Summarization
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Shamanth Kuthpadi Seethakantha, Dung Ngoc Thai, Vara Prasad Gudi, Simran Tiwari, Rami Matar, Avijit Mitra, Wenlong Zhao, Andrew McCallum, Wael Salloum
π‘ κ°μ
λ³Έ μ°κ΅¬λ μμ μμ½μμ LLMμ νκ°(hallucination) λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ νκ° νμ§κΈ°λ₯Ό νμ©ν μλ‘μ΄ λ°©λ²λ‘ μ μ μν©λλ€. μ μλ λ κ°μ§ λ°©λ²λ‘ μΈ "Hallucination Detection-Guided Preference Optimization" (itermodel)κ³Ό "Hallucination Detection-Guided Preference Optimization for Preference Learning" (model)μ μμ½μ μ¬μ€μ±μ κ°μ νκ³ νκ°μ ν¨κ³Όμ μΌλ‘ μ€μ λλ€. μ€ν κ²°κ³Ό, Llama λ° Gemma λͺ¨λΈμμ νκ°μ΄ ν¬κ² κ°μνμΌλ©°, μμ½μ μ μ°½μ±, μΌκ΄μ± λ° κ΄λ ¨μ±λ μ μ§λ¨μ μ μ¦νμ΅λλ€.
π μμ¬μ λ° νκ³
β’
νκ° νμ§κΈ°λ₯Ό νμ©ν λ°λ³΅μ μΈ μμ½ κ°μ μ΄ μμ μμ½μ μ¬μ€μ±μ λμ΄λ ν¨κ³Όμ μΈ μ λ΅μμ 보μ¬μ€λλ€.
β’
νμ§κΈ° κΈ°λ° κ°μ κ²½λ‘λ₯Ό μ νΈλ μμΌλ‘ λ³ννμ¬ λͺ¨λΈ λ―ΈμΈ μ‘°μ νλ λ°©μμ΄ νκ° κ°μμ ν¨κ³Όμ μμ μ μ¦ν©λλ€.
β’
μ μλ λ°©λ²λ‘ μ Llama λ° Gemmaμ κ°μ μ΅μ LLMμμ νκ°μ μ μλ―Ένκ² μ€μ΄λ©°, μμ μ 보μ μ νμ±μ λμ΄λ λ° κΈ°μ¬ν μ μμ΅λλ€.
β’
νκ° νμ§κΈ°μ μ±λ₯ μ체 λλ νμ§κΈ°μ μμ± λͺ¨λΈ κ°μ μνΈ μμ©μ λν μΆκ°μ μΈ μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage