Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

What Is Next for LLMs? Next-Generation AI Computing Hardware Using Photonic Chips

Created by
  • Haebom

저자

Renjie Li, Wenjie Wei, Qi Xin, Xiaoli Liu, Sixuan Mao, Erik Ma, Zijian Chen, Malu Zhang, Haizhou Li, Zhaoyu Zhang

개요

본 논문은 차세대 생성형 AI 컴퓨팅을 위한 떠오르는 광자 하드웨어를 조사하는 리뷰 논문입니다. 기존 폰 노이만 아키텍처를 넘어서는 컴퓨팅 패러다임 탐구의 필요성을 강조하며, 초고속 행렬 연산을 수행하는 통합 광자 신경망 아키텍처(예: Mach-Zehnder 간섭계 메쉬, 레이저, 파장 다중화 마이크로 링 공진기)와 스파이킹 신경망 회로 및 하이브리드 스핀트로닉-광자 시냅스와 같은 유망한 대체 뉴로모픽 장치를 검토합니다. 2차원 재료(그래핀, TMDC)를 실리콘 광자 플랫폼에 통합하여 조정 가능한 변조기와 칩 상 시냅스 요소를 구현하는 방법도 살펴봅니다. 트랜스포머 기반 LLM 아키텍처(셀프 어텐션 및 피드포워드 계층)를 분석하여 이러한 새로운 하드웨어 기판에 동적 행렬 곱셈을 매핑하는 전략과 과제를 파악하고, ChatGPT, DeepSeek, LLaMA와 같은 주류 LLM의 메커니즘을 분석하여 아키텍처의 유사점과 차이점을 강조합니다. 최첨단 구성 요소, 알고리즘 및 통합 방법을 종합하여 이러한 시스템을 대규모 LLM 모델로 확장하는 데 있어 주요 발전과 미해결 문제를 강조합니다. 광자 컴퓨팅 시스템은 처리량 및 에너지 효율 면에서 전자 프로세서를 훨씬 능가할 수 있지만, 특히 긴 컨텍스트 창과 긴 토큰 시퀀스의 메모리 및 초대형 데이터 세트의 저장과 같은 돌파구가 필요함을 보여줍니다.

시사점, 한계점

시사점:
광자 컴퓨팅이 LLM의 에너지 효율 및 처리량을 획기적으로 향상시킬 수 있는 잠재력 제시.
통합 광자 신경망 아키텍처 및 뉴로모픽 장치의 설계 및 구현에 대한 새로운 방향 제시.
2차원 재료의 활용을 통한 광자 컴퓨팅 시스템 성능 향상 가능성 확인.
LLM 아키텍처의 하드웨어 매핑 전략 및 과제 제시.
한계점:
긴 컨텍스트 창 및 긴 토큰 시퀀스를 위한 메모리 문제 해결 필요.
초대형 데이터 세트 저장 문제 해결 필요.
광자 컴퓨팅 시스템의 실제 구현 및 상용화에 대한 추가적인 연구 필요.
👍