Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

PRAGMA: A Profiling-Reasoned Multi-Agent Framework for Automatic Kernel Optimization

Created by
  • Haebom
Category
Empty

저자

Kelun Lei, Hailong Yang, Huaitao Zhang, Xin You, Kaige Zhang, Zhongzhi Luan, Yi Liu, Depei Qian

개요

PRAGMA는 실행 피드백과 미세한 하드웨어 프로파일링을 추론 루프에 통합하는 프로파일 기반 AI 커널 생성 프레임워크입니다. LLM을 사용하여 성능 병목 현상을 식별하고, 과거 최적 버전을 유지하며, 코드 품질을 반복적으로 개선합니다. KernelBench에서 CPU 및 GPU 백엔드를 대상으로 평가했으며, 프로파일링을 사용하지 않은 기존 AIKG보다 일관적으로 우수한 성능을 보였고, CPU 및 GPU 플랫폼에서 각각 Torch 대비 평균 2.81배 및 2.30배의 속도 향상을 달성했습니다.

시사점, 한계점

시사점:
PRAGMA는 AI를 활용하여 고성능 커널 생성을 자동화하는 새로운 프레임워크를 제시했습니다.
실행 피드백과 하드웨어 프로파일링을 결합하여 성능 병목 현상을 파악하고 코드 품질을 개선하는 데 성공했습니다.
CPU 및 GPU 플랫폼에서 기존 시스템 대비 상당한 성능 향상을 보였습니다.
한계점:
논문에서 구체적인 하드웨어 프로파일링 방법이나 LLM의 세부 구현 사항에 대한 자세한 정보는 제공되지 않았습니다.
KernelBench 외 다른 벤치마크나 실제 애플리케이션에 대한 성능 검증이 부족합니다.
모델의 일반화 능력과 다양한 하드웨어 환경에서의 적응성에 대한 추가적인 연구가 필요합니다.
👍