Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Real-Time Out-of-Distribution Failure Prevention via Multi-Modal Reasoning

Created by
  • Haebom

저자

Milan Ganai, Rohan Sinha, Christopher Agia, Daniel Morton, Marco Pavone

개요

본 논문은 대규모 시각 언어 모델(Large Vision and Language Models)의 높은 추론 지연 시간으로 인해 기존의 로봇 안전 개입 방법들이 수동으로 정의된 개입 정책에 의존하는 문제점을 해결하기 위해 FORTRESS 프레임워크를 제시합니다. FORTRESS는 실시간으로 의미적으로 안전한 대체 전략을 생성하고 추론하여 분포 외(OOD) 오류를 방지합니다. 정상 작동 시에는 다중 모달 추론기를 사용하여 목표를 식별하고 오류 모드를 예상하며, 런타임 모니터가 대체 응답을 트리거하면 실시간으로 의미적으로 안전하지 않은 영역을 추론하고 회피하면서 대체 목표에 대한 계획을 신속하게 합성합니다. 개방형 세계 다중 모달 추론과 역학 인식 계획을 결합하여 하드코딩된 대체 및 인간 안전 개입의 필요성을 없애고, 합성 벤치마크 및 실제 ANYmal 로봇 데이터에서 느린 추론 모델의 즉석 프롬프트보다 안전 분류 정확도가 높으며, 시뮬레이션 및 도시 항행용 쿼드로터 하드웨어에서 시스템 안전성과 계획 성공률을 향상시킵니다.

시사점, 한계점

시사점:
대규모 언어 모델을 활용하여 실시간으로 의미적으로 안전한 로봇의 대체 전략을 생성하는 새로운 프레임워크 FORTRESS 제시
수동으로 정의된 개입 정책에 대한 의존성을 제거하고 일반화 가능한 안전한 동작 계획 가능
합성 벤치마크와 실제 로봇 데이터에서 향상된 안전 분류 정확도 및 시스템 안전성, 계획 성공률 달성
개방형 세계, 다중 모달 추론과 역학 인식 계획의 결합을 통한 로봇 안전성 향상
한계점:
현재는 특정 로봇 플랫폼 (ANYmal, 쿼드로터)에 대한 실험 결과만 제시되어 다른 로봇 플랫폼으로의 일반화 가능성에 대한 추가 연구 필요
다양한 환경 및 상황에 대한 안전성과 견고성에 대한 추가적인 검증 필요
실시간 성능 달성을 위한 계산 비용 및 자원 소모에 대한 분석 필요
복잡한 상황에서의 의미적 안전성 정의 및 평가의 어려움
👍