ORCA: An Agentic Reasoning Framework for Hallucination and Adversarial Robustness in Vision-Language Models

작성자

Haebom

카테고리

Empty

저자

Chung-En Johnny Yu, Brian Jalaian, Nathaniel D. Bastian

💡 개요

대규모 비전-언어 모델(LVLM)은 강력한 다중 모드 능력을 보여주지만, 내재적 오류로 인한 환각 및 외부 공격으로 인한 적대적 취약성에 노출되어 신뢰성을 저해합니다. 본 논문은 ORCA라는 에이전트 기반 추론 프레임워크를 제안하며, 이는 소규모 비전 모델들을 활용하여 추론 시 구조화된 추론을 통해 사전 학습된 LVLM의 사실적 정확성과 적대적 강건성을 향상시킵니다. ORCA는 모델 내부 접근이나 재학습 없이 관찰-추론-비판-실행 루프를 통해 작동하며, 중간 추론 과정을 저장하여 감사 가능한 의사결정을 지원합니다.

🔑 시사점 및 한계

•

환각 완화 및 적대적 강건성 향상: ORCA는 명시적인 적대적 훈련이나 방어 기법 없이도 객체 수준의 환각을 줄이고 적대적 공격에 대한 강건성을 높여 LVLM의 신뢰성을 크게 향상시킵니다.

•

효율적인 에이전트 기반 추론: 소규모 비전 모델과 "Observe-Reason-Critique-Act" 루프를 활용하여 복잡한 LVLM을 재학습하거나 내부 구조에 접근하지 않고도 효과적인 추론을 가능하게 합니다.

•

감사 가능한 의사결정 지원: 중간 추론 과정을 저장함으로써 모델의 결정 과정을 추적하고 이해하는 데 도움을 줍니다.

•

한계점: 본 연구는 주로 객체 수준의 환각 완화에 초점을 맞추었으며, 다른 유형의 환각이나 더 복잡한 적대적 공격에 대한 ORCA의 효과는 추가적인 연구가 필요할 수 있습니다. 또한, 추론 과정에 사용되는 비전 도구들의 성능 및 효율성 최적화가 향후 과제가 될 수 있습니다.

PDF 보기

Made with Slashpage