本論文は、低遅延、高帯域幅、低エネルギー消費を提供する光学ベースのスイッチ、およびメモリサブシステムであるPhotonic Fabric™とPhotonic Fabric Appliance™(PFA)を提示します。高帯域幅HBM3Eメモリ、オンモジュール光学スイッチ、外部DDR5を2.5D電気光学システムのパッケージに統合し、最大32TBの共有メモリと115Tbpsの電電接続デジタルスイッチングを提供します。 Photonic Fabric™は、分散AI学習と推論で並列処理戦略をより効率的に実行できるようにします。既存のXPUアクセラレータ設計の固定メモリ演算比を制限するシリコン面積の制約を解決する。 XPUのローカルHBMスタックをPhotonic Fabricに接続されたチップレットに置き換えて、メモリ容量と帯域幅を拡張します。 NVIDIA H100およびH200システムに基づいて検証された軽量分析シミュレータCelestiSimを紹介し、GPUコア設計を変更せずにPFAでLLM推論性能と省エネ効果を評価します。シミュレーションの結果、405BパラメータLLM推論で最大3.66倍のスループット向上と1.40倍の遅延時間短縮、1Tパラメータでは最大7.04倍のスループット向上と1.41倍の遅延時間短縮、すべてのLLM学習シナリオでデータ移動エネルギー消費60-90%削減効果を示した。 NVIDIA GPUを対象に結果を提示したが、同じメモリ演算制約を共有する他のAIアクセラレータ設計(XPU)にも同様に適用することができる。