Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Training Frozen Feature Pyramid DINOv2 for Eyelid Measurements with Infinite Encoding and Orthogonal Regularization

Created by
  • Haebom

저자

Chun-Hung Chen

개요

본 연구는 스마트폰으로 촬영한 이미지를 이용하여 눈꺼풀 매개변수(MRD1, MRD2, LF)를 자동으로 측정하는 심층 학습 모델(SE-ResNet, EfficientNet, DINOv2)을 평가했습니다. MSE, MAE, R2 지표를 사용하여 성능을 평가한 결과, 자기 지도 학습을 통해 사전 훈련된 DINOv2가 특히 모바일 배포에 적합한 고정된 설정에서 뛰어난 확장성과 강건성을 보였습니다. MLP 및 Deep Ensemble과 같은 경량 회귀 모델은 최소한의 계산 오버헤드로 높은 정확도를 제공했습니다. 클래스 불균형 문제와 일반화 성능 향상을 위해 focal loss, orthogonal regularization, binary encoding 전략을 통합하였고, 이러한 개선 사항을 적용한 DINOv2는 모든 과제에서 일관되고 정확한 예측을 제공하여 실제 모바일 친화적인 임상 응용 프로그램에 적합한 후보임을 보여주었습니다. 본 연구는 기초 모델이 AI 기반 안과 의료 발전에 기여할 가능성을 강조합니다.

시사점, 한계점

시사점:
DINOv2 기반의 눈꺼풀 매개변수 자동 측정 모델이 모바일 환경에서 효과적으로 활용될 수 있음을 보여줌.
자기 지도 학습 기반의 사전 훈련 모델의 우수한 성능과 확장성을 확인.
경량 회귀 모델을 이용하여 계산 부담을 줄이면서 높은 정확도를 달성 가능함을 제시.
focal loss, orthogonal regularization, binary encoding 등의 전략을 통해 모델 성능 향상 가능성 제시.
AI 기반 안과 의료 발전에 기초 모델의 활용 가능성을 제시.
한계점:
본 연구에서 사용된 데이터셋의 크기 및 다양성에 대한 구체적인 정보 부족.
다양한 인종 및 연령대에 대한 일반화 성능에 대한 추가적인 검증 필요.
실제 임상 환경에서의 성능 검증 및 안전성 평가 필요.
특정 모델의 우수성을 보였지만, 다른 모델과의 비교 분석이 더욱 심도 있게 이루어질 필요가 있음.
👍