본 논문은 KAITIAN이라는 새로운 분산 통신 프레임워크를 소개합니다. KAITIAN은 자율 로봇 및 지능형 차량과 같은 구현 인공지능(Embodied AI) 시스템에서 다양한 이기종 가속기(예: GPGPUs, NPUs, FPGAs) 간의 상호 운용성 문제를 해결하기 위해 고안되었습니다. 기존의 벤더별 독점 통신 라이브러리의 증가로 인해 발생하는 상호 운용성 장벽을 극복하기 위해, KAITIAN은 그룹 내 효율성을 위한 벤더 최적화 통신 라이브러리와 그룹 간 상호 운용성을 위한 범용 통신 프로토콜을 지능적으로 통합하는 통합 추상화 계층을 제공합니다. 또한, 실시간 성능 특성에 따라 이기종 장치에 계산 작업을 동적으로 분산하는 부하 적응형 스케줄링 메커니즘을 통합합니다. PyTorch 확장으로 구현된 KAITIAN은 NVIDIA GPU와 Cambricon MLU를 갖춘 시험 환경에서 평가되었으며, 분산 학습 작업에 대한 자원 활용 및 확장성을 크게 향상시키는 것으로 나타났습니다. 실험 결과, KAITIAN은 기준 동종 시스템에 비해 학습 시간을 최대 42% 단축하면서 최소한의 통신 오버헤드(2.8~4.3%)로 모델 정확도를 유지합니다.