CHAI for LLMs: Improving Code-Mixed Translation in Large Language Models through Reinforcement Learning with AI Feedback
Created by
Haebom
저자
Wenbo Zhang, Aditya Majumdar, Amulya Yadav
개요
본 논문은 다국어 대규모 언어 모델(LLM)의 코드 혼합 언어 이해 능력 향상을 위한 새로운 프레임워크인 CHAI를 제안한다. 기존의 다국어 LLM은 코드 혼합 언어 번역 작업에서 효과적이지 못하다는 문제를 해결하기 위해, LLM을 이용한 정확한 주석 생성, 강화 학습을 통한 선호도 데이터 생성 및 실험적 평가를 수행하였다. CHAI는 코드 혼합 번역 작업에서 최첨단 오픈소스 LLM보다 25.66% 향상된 성능을 보였다.
시사점, 한계점
•
시사점:
◦
LLM을 이용한 코드 혼합 언어 번역 작업의 주석 생성 및 강화 학습 기반의 성능 향상 가능성을 제시하였다.
◦
CHAI 프레임워크는 다국어 LLM의 코드 혼합 언어 처리 능력 향상에 효과적임을 실험적으로 증명하였다.