Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PRAGMA: A Profiling-Reasoned Multi-Agent Framework for Automatic Kernel Optimization

Created by
  • Haebom
Category
Empty

저자

Kelun Lei, Hailong Yang, Huaitao Zhang, Xin You, Kaige Zhang, Zhongzhi Luan, Yi Liu, Depei Qian

개요

PRAGMA는 실행 피드백과 세분화된 하드웨어 프로파일링을 추론 루프에 통합하는 프로파일 기반 AI 커널 생성 프레임워크입니다. LLM을 사용하여 성능 병목 현상을 식별하고, 과거 최적 버전을 보존하며, 코드 품질을 반복적으로 개선합니다. PRAGMA는 GPU 및 CPU 백엔드에서 KernelBench를 사용하여 평가되었으며, 프로파일링이 활성화되지 않은 기존 AIKG보다 일관되게 우수한 성능을 보였고, CPU 및 GPU 플랫폼에서 Torch보다 평균 2.81배 및 2.30배 빠른 속도를 달성했습니다.

시사점, 한계점

시사점:
PRAGMA는 LLM을 활용하여 자동화된 커널 생성을 수행하며, 성능 병목 현상 파악 및 코드 품질 개선에 효과적입니다.
실행 피드백과 세분화된 하드웨어 프로파일링을 통합하여 AI 기반 커널 생성의 성능을 향상시켰습니다.
CPU 및 GPU 플랫폼에서 기존 시스템 대비 상당한 속도 향상을 보여주었습니다.
한계점:
논문에서 구체적인 한계점에 대한 언급은 명시적으로 나타나 있지 않습니다.
AI 모델의 성능은 학습 데이터의 품질과 양에 크게 의존하므로, 데이터 부족 시 성능 저하 가능성이 있습니다.
하드웨어 프로파일링 및 LLM 추론에 필요한 계산 비용이 높을 수 있습니다.
특정 하드웨어 환경 또는 커널 유형에 대한 일반화 가능성은 추가적인 연구가 필요합니다.
👍