본 논문은 첨가제 제조 공정에서 발생하는 결함 및 이상 현상을 자동으로 탐지하는 새로운 다중 모드 검색 증강 생성 기반 프레임워크를 제시합니다. 기존의 학습 데이터셋 대신 문헌(이미지 및 설명 텍스트 포함)에서 검색된 정보를 활용하여 다양한 첨가제 제조 공정에서 제로샷 이상 탐지, 분류 및 설명 생성을 수행합니다. 레이저 분말상 용융(L-PBF) 환경에서 텍스트 및 이미지 검색과 다중 모드 생성 모델을 통합하여 오크리지 국립 연구소의 네 가지 L-PBF 제조 데이터셋을 사용하여 평가하였으며, 다양한 프린터 제조업체, 모델 및 재료에 대한 프레임워크의 적응성과 일반화 가능성을 보여줍니다. GPT-4o-mini를 사용한 실험 결과가 Qwen2-VL-2B 및 무작위 기준선보다 우수함을 보였으며, 검색 메커니즘 통합으로 정확도가 12% 향상되었음을 확인했습니다. 새로운 연구를 지속적으로 통합하여 AM 기술의 발전에 맞춰 프레임워크를 원활하게 적용할 수 있습니다.
시사점, 한계점
•
시사점:
◦
첨가제 제조 공정에서의 이상 탐지를 위한 효율적이고 정확한 제로샷 접근 방식 제공.
◦
다양한 첨가제 제조 공정 및 데이터셋에 대한 적응력 및 일반화 가능성 증명.
◦
검색 메커니즘 통합을 통한 정확도 향상 및 환각 감소.
◦
지속적인 업데이트를 통한 AM 기술 발전에 대한 적응 가능성.
◦
자동화된 이상 분석을 통한 효율성 증대.
•
한계점:
◦
특정 L-PBF 데이터셋에 대한 평가 결과만 제시되어 다른 첨가제 제조 공정이나 데이터셋에 대한 일반화 가능성에 대한 추가 연구 필요.