# Improving Image Coding for Machines through Optimizing Encoder via Auxiliary Loss

### 저자

Kei Iino, Shunsuke Akamatsu, Hiroshi Watanabe, Shohei Enomoto, Akira Sakamoto, Takeharu Eda

### 💡 개요

본 연구는 기계 인식에 최적화된 이미지 코딩(ICM)을 위한 새로운 학습 방법을 제안한다. 기존 방식의 한계를 극복하기 위해 인코더에 보조 손실(auxiliary loss)을 적용하여 인식 능력과 압축 성능을 향상시키는 것을 목표로 한다. 이를 통해 객체 탐지 및 의미론적 분할 작업에서 기존 방식 대비 각각 27.7%, 20.3%의 Bjontegaard Delta율 개선을 달성하였다.

### 🔑 시사점 및 한계

- 인코더에 보조 손실을 추가함으로써 심층 신경망 기반의 인식 모델에서도 효율적인 ICM 학습이 가능함을 입증하였다.

- 기계 인식 작업에 특화된 이미지 압축 성능을 크게 향상시켜, 특정 목적을 위한 데이터 압축 분야에 대한 새로운 접근법을 제시한다.

- 제안된 방법의 일반적인 적용 가능성과 다양한 인식 태스크에서의 성능 검증이 추가적으로 필요하다.

---

[PDF 보기](https://arxiv.org/pdf/2402.08267)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
