Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Inference-Time Intervention in Large Language Models for Reliable Requirement Verification

Created by
  • Haebom
Category
Empty

저자

Paul Darm, James Xie, Annalisa Riccardi

개요

본 논문은 대규모 언어 모델(LLM)의 동작 제어, 특히 정확성과 신뢰성이 중요한 엔지니어링 애플리케이션에서의 제어 문제를 다룹니다. 미세 조정 및 프롬프트 방법의 한계를 지적하며, 추론 시간 개입 기법을 대안으로 제시합니다. 모델 기반 시스템 엔지니어링(MBSE)의 요구사항 검증 프로세스 자동화에 이 기법을 적용하여, 우주 임무의 Capella SysML 모델을 사용한 실험을 통해 개입된 LLM이 모델의 그래프 표현을 통해 요구사항 충족 여부를 판단하는 것을 보여줍니다. 일부 특정 어텐션 헤드(1~3개)를 수정하여 모델의 동작을 크게 변경하고, 자기 일관성과 결합하여 검증 집합에서 완벽한 정확도를 달성했습니다. 기존 모델 및 미세 조정 방법보다 성능이 크게 향상됨을 확인했습니다.

시사점, 한계점

시사점:
추론 시간 개입 기법을 통해 LLM의 동작을 정밀하게 제어할 수 있음을 보여줌.
MBSE의 요구사항 검증 프로세스 자동화에 효과적으로 적용 가능함.
소수의 어텐션 헤드 수정으로 LLM의 동작을 크게 변경할 수 있음.
자기 일관성과 결합하여 높은 정확도 달성 가능.
기존 방법(베이스라인 모델, 미세 조정)보다 성능 향상.
한계점:
Capella SysML 모델과 우주 임무라는 특정 도메인에 국한된 실험 결과.
다른 유형의 모델이나 엔지니어링 애플리케이션으로의 일반화 가능성에 대한 추가 연구 필요.
사용된 어텐션 헤드의 선택 기준 및 일반화 가능성에 대한 추가 설명 필요.
더 큰 규모의 모델 및 더 복잡한 요구사항에 대한 성능 평가 필요.
👍