본 논문은 차세대 생성형 AI 컴퓨팅을 위한 떠오르는 광자 하드웨어를 조사하는 리뷰 논문입니다. 기존 폰 노이만 아키텍처를 넘어서는 컴퓨팅 패러다임 탐구의 필요성을 강조하며, 초고속 행렬 연산을 수행하는 통합 광자 신경망 아키텍처(예: Mach-Zehnder 간섭계 메쉬, 레이저, 파장 다중화 마이크로 링 공진기)와 스파이킹 신경망 회로 및 하이브리드 스핀트로닉-광자 시냅스와 같은 유망한 대체 뉴로모픽 장치를 검토합니다. 2차원 재료(그래핀, TMDC)를 실리콘 광자 플랫폼에 통합하여 조정 가능한 변조기와 칩 상 시냅스 요소를 구현하는 방법도 살펴봅니다. 트랜스포머 기반 LLM 아키텍처(셀프 어텐션 및 피드포워드 계층)를 분석하여 이러한 새로운 하드웨어 기판에 동적 행렬 곱셈을 매핑하는 전략과 과제를 파악하고, ChatGPT, DeepSeek, LLaMA와 같은 주류 LLM의 메커니즘을 분석하여 아키텍처의 유사점과 차이점을 강조합니다. 최첨단 구성 요소, 알고리즘 및 통합 방법을 종합하여 이러한 시스템을 대규모 LLM 모델로 확장하는 데 있어 주요 발전과 미해결 문제를 강조합니다. 광자 컴퓨팅 시스템은 처리량 및 에너지 효율 면에서 전자 프로세서를 훨씬 능가할 수 있지만, 특히 긴 컨텍스트 창과 긴 토큰 시퀀스의 메모리 및 초대형 데이터 세트의 저장과 같은 돌파구가 필요함을 보여줍니다.