haebom
Sign In
Learning to Evolve: A Self-Improving Framework for Multi-Agent Systems via Textual Parameter Graph Optimization
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Shan He, Runze Wang, Zhuoyun Du, Huiyu Bai, Zouying Cao, Yu Cheng, Bo Zheng
π‘ κ°μ
λ³Έ λ Όλ¬Έμ 볡μ‘ν λ€μ€ μμ΄μ νΈ μμ€ν (MAS)μ μ€κ³ λ° μ΅μ ν λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ ν μ€νΈ κΈ°λ° νλΌλ―Έν° κ·Έλν μ΅μ ν(TPGO)λΌλ μλ‘μ΄ νλ μμν¬λ₯Ό μ μν©λλ€. TPGOλ MASλ₯Ό ꡬ쑰νλ ν μ€νΈ νλΌλ―Έν° κ·Έλν(TPG)λ‘ λͺ¨λΈλ§νκ³ , μ€ν νμ μμ μ»μ ν μ€νΈ κΈ°λ° κ·ΈλλμΈνΈλ₯Ό νμ©νμ¬ μμ΄μ νΈμ μ±λ₯μ κ°μ ν©λλ€. ν΅μ¬μ κ³Όκ±° μ΅μ ν κ²½νμ ν΅ν΄ μ€μ€λ‘λ₯Ό κ°μ νλ λ©ν νμ΅ μ λ΅μΈ Group Relative Agent Optimization(GRAO)μ λλ€.
π μμ¬μ λ° νκ³
β’
κΈ°μ‘΄μ νλ©΄μ μΈ ν둬ννΈ νλ λ°©μμΌλ‘λ νμ νκΈ° μ΄λ €μ λ MASμ 볡μ‘ν μνΈμμ©μ ꡬ쑰μ μΌλ‘ μ΄ν΄νκ³ κ°μ ν μ μμ΅λλ€.
β’
λ©ν νμ΅μ ν΅ν΄ μ΅μ ν μ λ΅ μ체λ₯Ό νμ΅νμ¬, μκ°μ΄ μ§λ¨μ λ°λΌ λμ± ν¨μ¨μ μ΄κ³ μλνλ MAS μ±λ₯ ν₯μμ λ¬μ±ν μ μμ΅λλ€.
β’
νμ¬ μ μλ TPGOλ 볡μ‘ν λ²€μΉλ§ν¬μμ μ°μν μ±λ₯μ 보μμ§λ§, μ€μ μ μ©μ μν΄μλ λ λ€μν MAS νκ²½μμμ κ²μ¦κ³Ό ν¨κ» ν μ€νΈ κ·ΈλλμΈνΈμ μ νμ± λ° ν¨μ¨μ± ν₯μμ λν μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage