Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning

Created by
  • Haebom

저자

Haoqiang Kang, Yizhe Zhang, Nikki Lijing Kuang, Nicklas Majamaki, Navdeep Jaitly, Yi-An Ma, Lianhui Qin

개요

본 논문은 대규모 언어 모델(LLM)의 추론 능력을 향상시키기 위해, 연속적인 잠재 표현의 표현력과 잠재 확산 모델의 반복적인 개선 능력을 통합한 새로운 추론 프레임워크인 LaDiR (Latent Diffusion Reasoner)을 제안한다. LaDiR은 텍스트 추론 단계를 의미 정보를 보존하면서도 간결하고 표현력 있는 표현을 제공하는 Variational Autoencoder (VAE)를 사용하여 구조화된 잠재 추론 공간을 구축한다. 그 후, 잠재 확산 모델을 활용하여 블록별 양방향 어텐션 마스크를 통해 잠재적 사고 토큰 블록을 노이즈 제거하도록 학습하며, 이를 통해 더 긴 수평선과 적응형 런타임 계산을 통한 반복적 개선이 가능하게 한다. 이 설계는 다양한 추론 궤적의 효율적인 병렬 생성을 가능하게 하여 모델이 추론 과정을 전체적으로 계획하고 수정할 수 있도록 한다. 수학적 추론 및 계획 벤치마크에서 LaDiR은 기존 자동 회귀, 확산 기반, 잠재 추론 방법보다 정확성, 다양성 및 해석 가능성을 일관되게 향상시켜 잠재 확산을 사용한 텍스트 추론의 새로운 패러다임을 제시한다.

시사점, 한계점

시사점:
LLM의 추론 능력을 향상시키기 위해 잠재 확산 모델을 활용한 새로운 프레임워크 제시
VAE를 사용하여 텍스트 추론 단계를 구조화된 잠재 공간에 인코딩하여 해석 가능성과 효율성을 확보
블록별 양방향 어텐션 마스크를 통한 반복적 개선 및 다양한 추론 궤적 생성 가능
수학적 추론 및 계획 벤치마크에서 기존 방법 대비 향상된 성능 입증
한계점:
논문에서 구체적인 한계점은 직접적으로 언급되지 않음 (해당 논문의 전체 내용을 알 수 없으므로, 일반적인 추론 기반 한계점 예상)
VAE 및 잠재 확산 모델 학습의 복잡성
잠재 공간의 최적화 및 해석에 대한 추가적인 연구 필요성
다른 LLM 아키텍처 및 다양한 작업에 대한 일반화 가능성 추가 검증 필요
👍