PRAGMA는 실행 피드백과 세분화된 하드웨어 프로파일링을 추론 루프에 통합하는 프로파일 기반 AI 커널 생성 프레임워크입니다. LLM을 사용하여 성능 병목 현상을 식별하고, 과거 최적 버전을 보존하며, 코드 품질을 반복적으로 개선합니다. PRAGMA는 GPU 및 CPU 백엔드에서 KernelBench를 사용하여 평가되었으며, 프로파일링이 활성화되지 않은 기존 AIKG보다 일관되게 우수한 성능을 보였고, CPU 및 GPU 플랫폼에서 Torch보다 평균 2.81배 및 2.30배 빠른 속도를 달성했습니다.
시사점, 한계점
•
시사점:
◦
PRAGMA는 LLM을 활용하여 자동화된 커널 생성을 수행하며, 성능 병목 현상 파악 및 코드 품질 개선에 효과적입니다.
◦
실행 피드백과 세분화된 하드웨어 프로파일링을 통합하여 AI 기반 커널 생성의 성능을 향상시켰습니다.
◦
CPU 및 GPU 플랫폼에서 기존 시스템 대비 상당한 속도 향상을 보여주었습니다.
•
한계점:
◦
논문에서 구체적인 한계점에 대한 언급은 명시적으로 나타나 있지 않습니다.
◦
AI 모델의 성능은 학습 데이터의 품질과 양에 크게 의존하므로, 데이터 부족 시 성능 저하 가능성이 있습니다.