KT, :, Yunjin Park, Jungwon Yoon, Junhyung Moon, Myunggyo Oh, Wonhyuk Lee, Sujin Kim Youngchol Kim, Eunmi Kim, Hyoungjun Park, Eunyoung Shin, Wonyoung Lee, Somin Lee, Minwook Ju, Minsung Noh, Dongyoung Jeong, Jeongyeop Kim, Wanjin Park, Soonmin Bae
개요
KT는 AI 서비스의 안전성과 신뢰성을 보장하기 위해 책임 있는 AI (RAI) 평가 방법론과 위험 완화 기술을 개발했습니다. AI 기본법 시행 및 글로벌 AI 거버넌스 동향 분석을 통해 규제 준수를 위한 고유한 접근 방식을 수립하고, AI 개발부터 운영까지 모든 잠재적 위험 요소를 체계적으로 식별하고 관리합니다. 국내 환경에 맞춰진 KT의 AI 위험 분류 체계를 기반으로 모델 안전성 및 견고성을 체계적으로 검증하는 신뢰할 수 있는 평가 방법론을 제시하며, 식별된 AI 위험을 관리하고 완화하기 위한 실용적인 도구도 제공합니다. 또한, 유해한 AI 모델의 응답을 실시간으로 차단하는 독점 기술인 SafetyGuard를 공개하여 국내 AI 개발 생태계의 안전성 향상을 지원합니다. 이러한 연구 결과는 책임 있는 AI 개발을 추구하는 조직에 귀중한 통찰력을 제공합니다.
시사점, 한계점
•
시사점:
◦
국내 AI 환경에 맞는 맞춤형 AI 위험 평가 방법론 제시.
◦
실시간 유해 응답 차단 기술 SafetyGuard 개발 및 공개를 통한 AI 안전성 강화.