VLM: 부정어를 잘 처리하도록 하는 프롬프팅 방법
부정어를 잘 처리하도록 하는 프롬프팅 방법 부정어를 인지하지 못하는 VLM(Vision Language Models) VLM을 사용하여 프롬프트 엔지니어링을 하다보면 '부정어' 보다는 '긍정어'를 사용할 때 결과가 훨씬 좋음을 체감하고 경험할 수 있습니다. '부정어'를 인식을 못하여 결과에 오류를 낼 때도 허다합니다. 관련하여, 최근 MIT 연구진의 부정어 관련 연구가 있어 정리해봤습니다. ✅ MIT 연구진이 실험한 'VLM의 부정어 이해 한계" 최근 MIT 연구진은 'VLM의 부정어 이해에' 한계가 있다고 실험 결과를 발표했습니다. VLM 이 '가 아니다', '하지 않는다' 와 같은 부정어 (negation)을 제대로 인식하지 못한다는 결론입니다. 이 연구는 특히 의료 진단, 제품 결함 감지 등 고위험 분야에서 VLM 을활용할 때, 부정어를 인식하지 못해 심각한 오류를 초래할 수 있음을 경고합니다. ✅ 연구의 핵심 요약 ✔️ 문제: 방사선 전문의가 흉부 엑스레이 판독시 "조직 부종은 있지만 심장 비대는 없다"라고 판단합니다. VLM을 활용해 비슷한 케이스 보고서를 찾으려 할 때, VLM이 부정어를 놓친다면 "심장 비대가 있다"는 보고서를 잘못 검색해 전혀 다른 진단 방향으로 흐릅니다. ✔️ 실험 결과: 부정어가 포함된 프롬프트에서 평균 이미지 검색 25% 감소 이미지 검색 25% 감소 VLM은 주로 “이미지 속 존재하는 객체”만을 기준으로 판단해, “부재(absence)”를 표현하는 부정어를 무시하는 경향(=긍정 편향, affirmation bias)이 강함
- Sujin_Kang

10