# Semantic Consistency for Assuring Reliability of Large Language Models

### 저자

Harsh Raj, Vipul Gupta, Domenic Rosati, Subhabrata Majumdar

### 개요

본 논문은 대규모 언어 모델(LLM)의 입력 프롬프트 변화에 대한 민감성 문제를 다룹니다.  같은 의미 또는 의도를 가진 표현으로 프롬프트를 했을 때 LLM의 출력이 일관성을 유지하는 것이 안전하고 신뢰할 수 있는 배포를 위해 중요합니다. 기존 연구는 단어나 문장 단위 답변의 어휘적 동일성에만 초점을 맞춘 반면, 본 논문은 개방형 텍스트 생성 시나리오에서 LLM의 일관성을 더 포괄적으로 이해하기 위해 새로운 의미적 일관성 측정 방법을 제시합니다.  이 방법은 기존의 어휘적 일관성 기반 지표보다 인간 평가와의 상관관계가 더 높은 일관성을 보여줍니다.  또한, 의미적 일관성을 향상시키는 새로운 프롬프팅 전략인 Ask-to-Choose (A2C)를 제안하고, TruthfulQA 벤치마크를 기반으로 한 폐쇄형 질문 답변에서 사전 훈련 및 미세 조정된 LLM의 정확도를 최대 47%까지, 지시어 조정 모델의 의미적 일관성 지표를 최대 7배까지 향상시키는 것을 보여줍니다.

### 시사점, 한계점

- **시사점:**

    - LLM의 의미적 일관성을 평가하기 위한 새로운 측정 지표를 제시하고, 기존 지표보다 인간 평가와의 상관관계가 높음을 보임.

    - 의미적 일관성을 향상시키는 새로운 프롬프팅 전략인 A2C를 제안하고, 실험적으로 그 효과를 검증함.

    - LLM의 안전하고 신뢰할 수 있는 배포를 위한 중요한 이슈를 해결하는 데 기여.

- **한계점:**

    - 제안된 의미적 일관성 측정 지표의 일반화 가능성에 대한 추가 연구 필요.

    - A2C 전략의 효과가 모든 유형의 LLM과 작업에 대해 일반화되는지 추가 실험 필요.

    - TruthfulQA 벤치마크에만 국한된 평가 결과의 일반성에 대한 검토 필요.

[PDF 보기](https://arxiv.org/pdf/2308.09138)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).