Revisiting the Reliability of Language Models in Instruction-Following

작성자

Haebom

카테고리

Empty

저자

Jianshuo Dong, Yutong Zhang, Yan Liu, Zhenyu Zhong, Tao Wei, Chao Zhang, Han Qiu

💡 개요

본 연구는 최신 언어 모델이 벤치마크에서 높은 지시 수행 정확도를 보이지만, 실제 사용 환경에서는 사용자 입력의 미묘한 변화에 대해 일관된 성능을 보이지 못하는 문제를 제기합니다. 이를 해결하기 위해 "뉘앙스 지향 신뢰성"을 정의하고, 새로운 평가 지표인 reliable@k와 자동화된 사촌 프롬프트 생성 파이프라인을 개발하여 IFEval++ 벤치마크를 구축했습니다. 연구 결과, 현재 언어 모델들은 사촌 프롬프트에 대한 신뢰성이 현저히 부족하며, 성능이 최대 61.8%까지 하락하는 것으로 나타났습니다.

🔑 시사점 및 한계

•

현재 언어 모델은 사용자 입력의 미묘한 변화에 대한 신뢰성이 매우 부족하며, 실제 서비스 적용에 대한 신중한 접근이 필요합니다.

•

"뉘앙스 지향 신뢰성"은 언어 모델의 신뢰성과 견고성을 향상시키기 위한 중요한 연구 방향을 제시합니다.

•

본 연구에서 제안된 자동화된 파이프라인과 IFEval++ 벤치마크는 향후 모델의 뉘앙스 지향 신뢰성을 평가하고 개선하는 데 기여할 수 있습니다.

•

모델의 뉘앙스 지향 신뢰성을 높이기 위한 개선 방법론에 대한 추가적인 탐색과 검증이 필요합니다.

PDF 보기

Made with Slashpage