본 논문은 다양한 유형의 데이터 통합(멀티모달)을 통한 최첨단 멀티모달 모델 개발의 중요성을 강조합니다. 특히, 다양한 모달리티와 도메인에서 적응 가능한 추론 엔진을 구축하기 위해서는 서로 다른 데이터 형태를 단일 잠재 공간에 최적으로 표현하는 것이 중요하며, 이는 아직 완전히 해결되지 않은 과제입니다. 이를 위해 논문에서는 다양한 모달리티 간 유사성을 극대화하고 추가적인 제약 조건을 부과하는 커널 CCA(Canonical Correlation Analysis)에서 영감을 받은 최적화 알고리즘 AlignXpert를 제안합니다. AlignXpert는 검색 및 분류와 같은 다양한 추론 작업에서 데이터 표현 개선에 미치는 영향을 보여주며, 데이터 표현의 중요성을 강조합니다.