Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

KForge: Program Synthesis for Diverse AI Hardware Accelerators

Created by
  • Haebom
Category
Empty

저자

Taras Sereda, Tom St. John, Burak Bartan, Natalie Serrino, Sachin Katti, Zain Asgar

개요

KForge는 다양한 가속기에서 ML 성능 최적화를 위해 설계된 플랫폼 독립적인 프레임워크입니다. LLM 기반 에이전트 2개(생성 에이전트 및 성능 분석 에이전트)를 활용하여, 컴파일 및 정확성 피드백을 통해 프로그램을 생성하고 반복적으로 개선하며, 프로파일링 데이터를 해석하여 최적화를 안내합니다. 이 에이전트 기반 아키텍처는 새로운 플랫폼을 타겟팅하기 위해 단일 샷 예제만 필요합니다.

시사점, 한계점

생성 에이전트와 성능 분석 에이전트가 기능 및 최적화 단계를 통해 협력하여 다양한 프로파일링 데이터를 해석하고 실행 가능한 권장 사항을 생성하여 임의의 가속기를 위한 프로그램 합성을 안내하는 반복적인 개선 시스템을 도입했습니다.
한 아키텍처의 레퍼런스 구현이 다른 하드웨어 타겟에 대한 생성 품질을 크게 향상시키는 크로스 플랫폼 지식 이전을 효과적으로 활용함을 입증했습니다.
NVIDIA CUDA 및 Apple Metal과 같이 근본적으로 다른 병렬 컴퓨팅 플랫폼에서 효과적인 프로그램 합성을 시연하여 플랫폼 독립적인 접근 방식의 유효성을 검증했습니다.
👍