haebom
Sign In
AtomEval: Validity-Aware Atomic Evaluation of Adversarial Claim Rewriting in Fact Verification
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Hongyi Cen, Mingxin Wang, Yule Liu, Jingyi Zheng, Hanze Jia, Tan Tang
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ΄ κ·Όκ±° κΈ°λ° μ¬μ€ κ²μ¦ μμ€ν μ ννΌνκΈ° μν΄ λ°λ°λ μ£Όμ₯μ μ¬μμ±νλ λ¬Έμ λ₯Ό λ€λ£Ήλλ€. κΈ°μ‘΄μ 곡격 μ±κ³΅λ₯ (ASR)μ μ¬μμ±λ μ£Όμ₯μ΄ μλμ μλͺ»λ λͺ μ λ₯Ό μ½νμν€κ±°λ λ³κ²½νλ κ²½μ°μλ 곡격 μ±κ³΅μΌλ‘ κ°μ£Όλ μ μμ΄ κ³Όλνκ°λ μ μμ΅λλ€. μ΄λ₯Ό ν΄κ²°νκΈ° μν΄, λ³Έ λ Όλ¬Έμ μ£Όμ₯μ SROM(Subject-Relation-Object-Modifier) μμ λ¨μλ‘ νννκ³ , μ ν¨ν ννΌμ λͺ μ λ³κ²½μ ꡬλΆνλ 'μ ν¨μ± 보쑴 κ²μ΄νΈ'λ₯Ό λμ νμ¬ 'μ ν¨μ± μΈμ 곡격 μ±κ³΅λ₯ (VASR)'μ μ μν©λλ€.
π μμ¬μ λ° νκ³
β’
LLM κΈ°λ°μ μ λμ μ£Όμ₯ μ¬μμ±μ΄ κΈ°μ‘΄ νκ° λ°©μμμ κ³Όλνκ°λ μ μμμ λͺ νν νκ³ , μ΄λ₯Ό 보μν μ μλ μλ‘μ΄ νκ° μ§ν(VASR)λ₯Ό μ μν©λλ€.
β’
μ μλ AtomEvalμ μ£Όμ₯ μ¬μμ±μ λ κ°μ§ μ€μν μΈ‘λ©΄, μ¦ κ²μ¦ μμ€ν ννΌμ μλ λͺ μ μ μ§μ€μ± μ μ§ μ¬λΆλ₯Ό λΆλ¦¬νμ¬ λΆμν¨μΌλ‘μ¨ λ μ ννκ³ μ€λͺ κ°λ₯ν νκ°λ₯Ό κ°λ₯νκ² ν©λλ€.
β’
λ Όλ¬Έμμ μ μλ SROM μμ νν λ° μ ν¨μ± 보쑴 κ²μ΄νΈμ μ€μ μ μ© λ²μμ 볡μ‘ν μ£Όμ₯ ꡬ쑰μμμ νμ₯ κ°λ₯μ±μ λν μΆκ° μ°κ΅¬κ° νμν μ μμ΅λλ€.
PDF 보기
Made with Slashpage