본 논문은 블랙박스 신경망의 해석 가능한 대리 모델을 합성하기 위한 방법인 오토마타 추출을 연구합니다. 기존 기술은 유한 입력 알파벳을 가정하여 연속 도메인에서 추출된 데이터 시퀀스에 직접 적용할 수 없다는 문제를 해결하기 위해, 숫자 값을 저장하고 비교하는 레지스터를 갖춘 결정적 레지스터 오토마타(DRA)를 제안합니다. 주요 기여는 블랙박스 모델에서 강력한 DRA 추출을 위한 프레임워크 개발입니다. 고정된 수의 레지스터를 가진 DRA에 대한 다항 시간 견고성 검사기를 개발하고, 이를 수동 및 능동 오토마타 학습 알고리즘과 결합합니다. 이 결합을 통해 통계적 견고성과 동등성 보장을 갖춘 대리 DRA를 얻습니다. 주요 응용 분야로, 추출된 오토마타를 사용하여 신경망의 견고성을 평가합니다. 주어진 시퀀스와 거리 메트릭에 대해 DRA는 로컬 견고성을 인증하거나 구체적인 반례를 생성합니다. 순환 신경망 및 변환기 아키텍처에 대한 실험을 통해 제안된 프레임워크가 정확한 오토마타를 안정적으로 학습하고 원칙적인 견고성 평가를 가능하게 함을 보여줍니다. 결과적으로, 강력한 DRA 추출은 기본 네트워크에 대한 화이트박스 접근 방식 없이 신경망 해석 가능성과 형식적 추론을 효과적으로 연결합니다.