Sign In

AtomEval: Validity-Aware Atomic Evaluation of Adversarial Claim Rewriting in Fact Verification

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Hongyi Cen, Mingxin Wang, Yule Liu, Jingyi Zheng, Hanze Jia, Tan Tang

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)이 κ·Όκ±° 기반 사싀 검증 μ‹œμŠ€ν…œμ„ νšŒν”Όν•˜κΈ° μœ„ν•΄ λ°˜λ°•λœ μ£Όμž₯을 μž¬μž‘μ„±ν•˜λŠ” 문제λ₯Ό λ‹€λ£Ήλ‹ˆλ‹€. 기쑴의 곡격 성곡λ₯ (ASR)은 μž¬μž‘μ„±λœ μ£Όμž₯이 μ›λž˜μ˜ 잘λͺ»λœ λͺ…μ œλ₯Ό μ•½ν™”μ‹œν‚€κ±°λ‚˜ λ³€κ²½ν•˜λŠ” κ²½μš°μ—λ„ 곡격 μ„±κ³΅μœΌλ‘œ 간주될 수 μžˆμ–΄ κ³ΌλŒ€ν‰κ°€λ  수 μžˆμŠ΅λ‹ˆλ‹€. 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, λ³Έ 논문은 μ£Όμž₯을 SROM(Subject-Relation-Object-Modifier) μ›μž λ‹¨μœ„λ‘œ ν‘œν˜„ν•˜κ³ , μœ νš¨ν•œ νšŒν”Όμ™€ λͺ…μ œ 변경을 κ΅¬λΆ„ν•˜λŠ” 'μœ νš¨μ„± 보쑴 게이트'λ₯Ό λ„μž…ν•˜μ—¬ 'μœ νš¨μ„± 인식 곡격 성곡λ₯ (VASR)'을 μ œμ•ˆν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM 기반의 μ λŒ€μ  μ£Όμž₯ μž¬μž‘μ„±μ΄ κΈ°μ‘΄ 평가 λ°©μ‹μ—μ„œ κ³ΌλŒ€ν‰κ°€λ  수 μžˆμŒμ„ λͺ…ν™•νžˆ ν•˜κ³ , 이λ₯Ό 보완할 수 μžˆλŠ” μƒˆλ‘œμš΄ 평가 μ§€ν‘œ(VASR)λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ AtomEval은 μ£Όμž₯ μž¬μž‘μ„±μ˜ 두 κ°€μ§€ μ€‘μš”ν•œ μΈ‘λ©΄, 즉 검증 μ‹œμŠ€ν…œ νšŒν”Όμ™€ μ›λž˜ λͺ…μ œμ˜ μ§„μ‹€μ„± μœ μ§€ μ—¬λΆ€λ₯Ό λΆ„λ¦¬ν•˜μ—¬ λΆ„μ„ν•¨μœΌλ‘œμ¨ 더 μ •ν™•ν•˜κ³  μ„€λͺ… κ°€λŠ₯ν•œ 평가λ₯Ό κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.
β€’
λ…Όλ¬Έμ—μ„œ μ œμ‹œλœ SROM μ›μž ν‘œν˜„ 및 μœ νš¨μ„± 보쑴 게이트의 μ‹€μ œ 적용 λ²”μœ„μ™€ λ³΅μž‘ν•œ μ£Όμž₯ κ΅¬μ‘°μ—μ„œμ˜ ν™•μž₯ κ°€λŠ₯성에 λŒ€ν•œ μΆ”κ°€ 연ꡬ가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘