본 논문은 인공지능(AI) 시스템의 윤리적 행동을 형식적으로 정의하고 평가하는 방법을 제안한다. 특히 시스템 수준의 명세에 초점을 맞춰 의무 논리(deontic logic) 기반의 형식화를 제시하며, 공정성과 설명 가능성과 관련된 윤리적 요구사항을 포착하는 공리와 정리를 소개한다. 시간적 연산자를 통합하여 시간에 따른 AI 시스템의 윤리적 행동을 추론하고, COMPAS와 대출 예측 AI 시스템을 실제 사례로 평가한다. 의무 논리 공식을 사용하여 이 시스템들의 다양한 윤리적 속성을 인코딩하고, 자동 정리 증명기를 활용하여 정의된 속성을 충족하는지 확인한다. 형식적 검증 결과, 두 시스템 모두 공정성 및 차별 금지와 관련된 핵심 윤리적 속성을 충족하지 못함을 보여주며, 제안된 형식화가 실제 AI 애플리케이션의 잠재적 윤리적 문제를 식별하는 데 효과적임을 증명한다.