Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Evaluating perturbation robustnessof generative systems that use COBOL code inputs

Created by
  • Haebom
Category
Empty

저자

Samuel Ackerman, Wesam Ibraheem, Orna Raz, Marcel Zalmanovici

개요

본 논문은 대규모 언어 모델(LLM)을 활용하는 시스템의 견고성을 평가하기 위한 프레임워크를 제시한다. 특히, COBOL 코드를 입력으로 사용하는 시스템의 견고성을 중점적으로 다루며, COBOL과 Java 간의 번역을 예시로 든다. COBOL은 중요한 업무에 사용되지만, 독점적인 레거시 애플리케이션으로 인해 LLM 훈련에 사용하기 어렵다는 점을 고려하여, COBOL 코드의 변형 방법을 개발하고 벤치마크 데이터셋을 확장하여 시스템의 견고성을 평가한다. 개별 및 집계 메트릭을 사용하여 LLM 기반 시스템의 출력 변화를 측정하고, 시각화 대시보드를 통해 시스템의 출력 디버깅, 입력 변동에 대한 근본 원인 분석을 돕는다.

시사점, 한계점

시사점:
COBOL 코드를 입력으로 사용하는 시스템의 견고성 평가를 위한 프레임워크 제시.
COBOL 코드 변형 방법 및 확장된 벤치마크 데이터셋 개발.
시스템의 출력 변화를 측정하기 위한 메트릭 정의.
디버깅 및 근본 원인 분석을 위한 시각화 도구 개발.
시스템 개선을 위한 사전 처리 단계 제안.
한계점:
특정 번역 작업(COBOL to Java)에 초점을 맞춤.
견고성 평가에 사용된 데이터셋 및 변형 방법의 일반화 가능성에 대한 추가 연구 필요.
제안된 시각화 도구의 효과에 대한 추가적인 사용자 연구 필요.
시스템의 견고성을 향상시키기 위한 구체적인 방법론 제시 부족.
👍