전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다. 본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다. 논문에 대한 저작권은 저자 및 해당 기관에 있으며, 요약본 공유 시 출처만 명기하면 됩니다. This service is supported by Google Gemini.
OneShield -- the Next Generation of LLM Guardrails
Created by
Haebom
Category
Empty
저자
Chad DeLuca, Anna Lisa Gentile, Shubhi Asthana, Bing Zhang, Pawan Chowdhary, Kellen Cheng, Basel Shbita, Pengyuan Li, Guang-Jie Ren, Sandeep Gopisetty
개요
본 논문은 대규모 언어 모델(LLM)의 급부상으로 인해 발생하는 안전, 개인 정보 보호 및 윤리적 문제에 대한 해결책으로, 모델 독립적이고 사용자 지정 가능한 독립형 솔루션인 OneShield를 제안합니다. OneShield는 위험 요소 정의, 상황별 안전 및 규정 준수 정책 표현 및 선언, 그리고 각 특정 고객에 초점을 맞춘 LLM 위험 완화 기능을 제공하는 것을 목표로 합니다. 논문에서는 프레임워크 구현, 확장성 고려 사항, 그리고 초기 배포 이후 OneShield의 사용 통계를 설명합니다.