haebom
Sign In
AgentNoiseBench: Benchmarking Robustness of Tool-Using LLM Agents Under Noisy Condition
Created by
Haebom
Category
Empty
μ μ
Ruipeng Wang, Yuxin Chen, Yukai Wang, Chang Wu, Junfeng Fang, Xiaodong Cai, Qi Gu, Hui Su, An Zhang, Xiang Wang, Xunliang Cai, Tat-Seng Chua
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μ€μ νκ²½μμ LLM κΈ°λ° μμ΄μ νΈμ μ±λ₯ μ ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄, λ Έμ΄μ¦ νκ²½μμμ κ²¬κ³ μ±μ 체κ³μ μΌλ‘ νκ°νλ
AgentNoiseBench
νλ μμν¬λ₯Ό μ μνλ€. μ¬μ©μμ λꡬμμ λ°μνλ λ Έμ΄μ¦λ₯Ό λΆμνκ³ μ μ΄ κ°λ₯ν λ°©μμΌλ‘ κΈ°μ‘΄ λ²€μΉλ§ν¬μ μ£Όμ νμ¬, λ€μν LLM μμ΄μ νΈμ μ±λ₯ λ³νλ₯Ό κ΄λ²μνκ² νκ°νλ€. μ°κ΅¬ κ²°κ³Ό, νμ¬ μμ΄μ νΈλ€μ νμ€μ μΈ λ Έμ΄μ¦μ λ―Όκ°νκ² λ°μνλ©° μ±λ₯ λ³λμ 보μμ νμΈνλ€.
π μμ¬μ λ° νκ³
β’
μ€μ νκ²½μ λΉμ΄μμ μ΄κ³ λΆμμ ν νΉμ±μ κ³ λ €ν LLM μμ΄μ νΈ κ²¬κ³ μ± νκ°μ μ€μμ±μ κ°μ‘°νλ€.
β’
μ¬μ©μμ λꡬμμ λ°μνλ λ Έμ΄μ¦ μ νμ λΆλ₯νκ³ μ΄λ₯Ό μ μ΄ κ°λ₯ν λ²€μΉλ§ν¬λ‘ ꡬννμ¬ ν₯ν κ΄λ ¨ μ°κ΅¬μ κΈ°λ°μ λ§λ ¨νλ€.
β’
λ€μν λͺ¨λΈ μν€ν μ²μ κ·λͺ¨μμμ μ±λ₯ λ³νλ₯Ό 보μ¬μ£Όλ©°, νμ¬ LLM μμ΄μ νΈμ νμ€μ μΈ νκ²½ μ μλ ₯μ λν ν΅μ°°μ μ 곡νλ€.
β’
(νκ³μ λλ ν₯ν κ³Όμ ) λ Έμ΄μ¦μ μ’ λ₯ λ° κ°λμ λ°λ₯Έ μμ΄μ νΈ μ±λ₯ μ ν λ©μ»€λμ¦μ λν λ μ¬μΈ΅μ μΈ λΆμκ³Ό, λ Έμ΄μ¦μ κ°κ±΄ν μμ΄μ νΈ κ°λ°μ μν μλ‘μ΄ νμ΅ λ° νκ° λ°©λ²λ‘ μ°κ΅¬κ° νμνλ€.
PDF 보기
Made with Slashpage