Sign In

What Do Evolutionary Coding Agents Evolve?

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Nico Pelleriti, Sree Harsha Nelaturu, Zhanke Zhou, Zongze Li, Max Zimmer, Bo Han, Sebastian Pokutta

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” μ–Έμ–΄ λͺ¨λΈ(LLM)κ³Ό 진화적 탐색을 κ²°ν•©ν•˜μ—¬ μ½”λ“œλ₯Ό 생성, μˆ˜μ •, μ„ νƒν•˜λŠ” μ‹œμŠ€ν…œμ˜ μ‹€μ œ μ§„ν™” 과정을 규λͺ…ν•˜κ³ μž ν•©λ‹ˆλ‹€. 기쑴의 평가 방식이 μ΅œμ’… μ„±λŠ₯ μ μˆ˜μ—λ§Œ μ§‘μ€‘ν•˜μ—¬ μ‹€μ œ μ§„ν™” λ©”μ»€λ‹ˆμ¦˜μ„ νŒŒμ•…ν•˜κΈ° μ–΄λ ΅λ‹€λŠ” ν•œκ³„μ μ„ μ§€μ ν•˜λ©°, μ§„ν™” 과정을 μƒμ„Ένžˆ κΈ°λ‘ν•œ EvoTrace 데이터셋과 이λ₯Ό λΆ„μ„ν•˜κΈ° μœ„ν•œ EvoReplay 방법둠을 μ œμ•ˆν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 μ§„ν™” μ½”λ”© μ—μ΄μ „νŠΈμ˜ μ„±λŠ₯ ν–₯상이 μƒˆλ‘œμš΄ μ•Œκ³ λ¦¬μ¦˜ ꡬ쑰뿐만 μ•„λ‹ˆλΌ κΈ°μ‘΄ μ „λž΅μ˜ μž¬μ‘°μ •, λͺ¨λΈ λ‚΄λΆ€ μ§€μ‹μ˜ μž¬μ‘°ν•©, ν‰κ°€μžμ— λŒ€ν•œ 과적합 λ“± λ‹€μ–‘ν•œ μš”μΈμ— μ˜ν•΄ λ°œμƒν•  수 μžˆμŒμ„ λ°ν˜”μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ§„ν™” μ½”λ”© μ—μ΄μ „νŠΈμ˜ μ„±λŠ₯ ν–₯상은 단일 λ©”μ»€λ‹ˆμ¦˜μ΄ μ•„λ‹Œ, μƒˆλ‘œμš΄ μ•Œκ³ λ¦¬μ¦˜ ꡬ쑰 발견, κΈ°μ‘΄ μ „λž΅ μ΅œμ ν™”, λͺ¨λΈ λ‚΄λΆ€ μ§€μ‹μ˜ μž¬μ‘°ν•© λ“± μ—¬λŸ¬ λ©”μ»€λ‹ˆμ¦˜μ˜ 볡합적인 결과둜 λ‚˜νƒ€λ‚  수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
μ§„ν™” κ³Όμ •μ—μ„œ 반볡적으둜 μ‚­μ œλ˜μ—ˆλ‹€κ°€ λ‹€μ‹œ λ„μž…λ˜λŠ” μ½”λ“œ 라인이 μƒλ‹Ήμˆ˜ μ‘΄μž¬ν•˜λ©°, μ΄λŠ” μ„±λŠ₯ ν–₯μƒμ˜ ν•œ 좕을 λ‹΄λ‹Ήν•˜μ§€λ§Œ μƒˆλ‘œμš΄ μ•Œκ³ λ¦¬μ¦˜μ  ν˜μ‹ κ³ΌλŠ” 거리가 λ©€ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬μ—μ„œ μ œμ•ˆλœ EvoTrace 데이터셋과 EvoReplay 방법둠은 μ§„ν™” μ½”λ”© μ—μ΄μ „νŠΈμ˜ 평가λ₯Ό μ΅œμ’… 점수 λ„ˆλ¨Έμ˜ μ§„ν™” λ©”μ»€λ‹ˆμ¦˜κΉŒμ§€ ν™•μž₯ν•˜μ—¬ 보닀 진단적인 뢄석을 κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬μ˜ LLM-as-judge νŒŒμ΄ν”„λΌμΈμ€ 인간 μž¬μ£Όμ„κ³Όμ˜ 비ꡐλ₯Ό 톡해 κ²€μ¦λ˜μ—ˆμœΌλ‚˜, λͺ¨λ“  μ’…λ₯˜μ˜ μ½”λ“œ νŽΈμ§‘μ„ μ™„λ²½ν•˜κ²Œ λΆ„λ₯˜ν•˜λŠ” λ°λŠ” μ—¬μ „νžˆ ν•œκ³„κ°€ μžˆμ„ 수 있으며, 이λ₯Ό λ³΄μ™„ν•˜κΈ° μœ„ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘