AI 가속은 GPU가 주도해 왔으나, 낮은 지연 시간, 에너지 효율성 및 세분화된 하드웨어 제어에 대한 요구가 증가하면서 고정 아키텍처의 한계가 드러나고 있다. 이에 따라, FPGA(Field-Programmable Gate Array)는 AI 알고리즘을 장치 로직에 직접 매핑할 수 있는 재구성 가능한 플랫폼으로 부상하고 있다. FPGA는 컨볼루션, 어텐션 메커니즘, 후처리를 병렬 파이프라인으로 구현하여 결정론적 타이밍과 전력 소비 감소를 가능하게 하여, 예측 가능한 성능과 깊은 사용자 지정을 요구하는 워크로드에 전략적인 옵션이 된다. CPU 및 GPU와 달리 FPGA는 특정 모델에 맞게 물리적 구조를 재구성할 수 있으며, 내장 프로세서와 SoC로 통합하고 센서 근처에서 추론을 실행하여 지연 시간과 대역폭 요구 사항을 줄이고, 개인 정보 보호를 개선하며, 데이터 센터에서 GPU를 특화된 작업에서 해방시킨다. 부분 재구성 및 AI 프레임워크의 컴파일 흐름은 프로토타입에서 배포까지의 경로를 단축하여 하드웨어-알고리즘 공동 설계를 가능하게 한다.