Sign In

Bridging Generation and Training: A Systematic Review of Quality Issues in LLMs for Code

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Kaifeng He, Xiaojun Zhang, Peiliang Cai, Mingwei Liu, Yanlin Wang, Chong Wang, Kaifeng Huang, Bihuan Chen, Xin Peng, Zibin Zheng

πŸ’‘ κ°œμš”

λ³Έ 논문은 μ½”λ“œ 생성 LLMμ—μ„œ λ°œμƒν•˜λŠ” λ‹€μ–‘ν•œ 결함이 λͺ¨λΈ 자체의 ν•œκ³„λ³΄λ‹€λŠ” ν•™μŠ΅ λ°μ΄ν„°μ˜ ν’ˆμ§ˆ λ¬Έμ œμ—μ„œ λΉ„λ‘―λœλ‹€λŠ” 점에 μ£Όλͺ©ν•©λ‹ˆλ‹€. 114편의 논문을 μ²΄κ³„μ μœΌλ‘œ κ²€ν† ν•˜μ—¬ ν•™μŠ΅ 데이터 ν’ˆμ§ˆ μ΄μŠˆκ°€ μ½”λ“œ 생성 결과의 ν’ˆμ§ˆ 이슈둜 μ „νŒŒλ˜λŠ” λ©”μ»€λ‹ˆμ¦˜μ„ 규λͺ…ν•˜κ³ , μ½”λ“œ 및 λΉ„μ½”λ“œ μ†μ„±λ³„λ‘œ ν•™μŠ΅ 데이터 ν’ˆμ§ˆ 이슈λ₯Ό λΆ„λ₯˜ν•˜λŠ” 톡합 λΆ„λ₯˜ 체계λ₯Ό μ œμ‹œν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 데이터, λͺ¨λΈ, 생성 생λͺ…μ£ΌκΈ° μ „λ°˜μ— 걸친 탐지 및 μ™„ν™” κΈ°μˆ μ„ μ’…ν•©ν•˜κ³ , μ‹ λ’°ν•  수 μžˆλŠ” μ½”λ“œ 생성 LLM κ°œλ°œμ„ μœ„ν•œ ν–₯ν›„ 연ꡬ λ°©ν–₯을 μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μ½”λ“œ 생성 LLM의 ν’ˆμ§ˆ λ¬Έμ œλŠ” 주둜 ν•™μŠ΅ λ°μ΄ν„°μ˜ ν’ˆμ§ˆμ—μ„œ κΈ°μΈν•˜λ©°, μ΄λŠ” λͺ¨λΈ 개발 μ‹œ 데이터 κ±°λ²„λ„ŒμŠ€μ˜ μ€‘μš”μ„±μ„ λΆ€κ°ν•©λ‹ˆλ‹€.
β€’
μ—°κ΅¬λŠ” ν’ˆμ§ˆ 보증이 생성 ν›„ ν•„ν„°λ§μ—μ„œ 데이터 μ€‘μ‹¬μ˜ 사전 예방적 κ±°λ²„λ„ŒμŠ€ 및 폐쇄 루프 수리둜 μ „ν™˜λ˜λŠ” 방법둠적 λ³€ν™”λ₯Ό λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
ν˜„μž¬κΉŒμ§€ ν•™μŠ΅ 데이터 ν’ˆμ§ˆ λ¬Έμ œκ°€ 생성 μ½”λ“œ ν’ˆμ§ˆ 문제둜 μ „νŒŒλ˜λŠ” ꡬ체적인 λ©”μ»€λ‹ˆμ¦˜μ— λŒ€ν•œ 체계적인 이해가 λΆ€μ‘±ν•˜λ©°, 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•œ 톡합적인 데이터 νλ ˆμ΄μ…˜ 및 지속적인 평가가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘