본 논문은 저지연, 고대역폭, 저 에너지 소비를 제공하는 광자 기반 스위치 및 메모리 서브시스템인 Photonic Fabric™과 Photonic Fabric Appliance™ (PFA)를 제시한다. 고대역폭 HBM3E 메모리, 온모듈 광 스위치, 외부 DDR5를 2.5D 전기광학 시스템 인 패키지에 통합하여 최대 32TB의 공유 메모리와 115Tbps의 전대역 디지털 스위칭을 제공한다. Photonic Fabric™은 분산 AI 학습 및 추론에서 병렬 처리 전략을 더 효율적으로 실행할 수 있도록 한다. 기존 XPU 가속기 설계의 고정된 메모리-연산 비율을 제한하는 실리콘 면적 제약을 해결한다. XPU의 로컬 HBM 스택을 Photonic Fabric에 연결되는 칩렛으로 교체하여 메모리 용량과 대역폭을 확장한다. NVIDIA H100 및 H200 시스템에서 검증된 경량 분석 시뮬레이터 CelestiSim을 사용하여 GPU 코어 설계 변경 없이 PFA에서 LLM 추론 성능 및 에너지 절약 효과를 평가했다. 시뮬레이션 결과, 405B 매개변수 LLM 추론에서 최대 3.66배의 처리량 및 1.40배의 지연 시간 개선, 1T 매개변수에서 최대 7.04배의 처리량 및 1.41배의 지연 시간 개선, 모든 LLM 학습 시나리오에서 데이터 이동 에너지 소비 60-90% 절감을 보였다. NVIDIA GPU에 대한 결과이지만, 동일한 메모리-연산 제약을 가진 다른 AI 가속기 설계(XPU)에도 유사하게 적용 가능하다.