KForge: Program Synthesis for Diverse AI Hardware Accelerators
Created by
Haebom
Category
Empty
저자
Taras Sereda, Tom St. John, Burak Bartan, Natalie Serrino, Sachin Katti, Zain Asgar
개요
KForge는 다양한 가속기에서 ML 성능 최적화를 위해 설계된 플랫폼 독립적인 프레임워크입니다. LLM 기반 에이전트 2개(생성 에이전트 및 성능 분석 에이전트)를 활용하여, 컴파일 및 정확성 피드백을 통해 프로그램을 생성하고 반복적으로 개선하며, 프로파일링 데이터를 해석하여 최적화를 안내합니다. 이 에이전트 기반 아키텍처는 새로운 플랫폼을 타겟팅하기 위해 단일 샷 예제만 필요합니다.
시사점, 한계점
•
생성 에이전트와 성능 분석 에이전트가 기능 및 최적화 단계를 통해 협력하여 다양한 프로파일링 데이터를 해석하고 실행 가능한 권장 사항을 생성하여 임의의 가속기를 위한 프로그램 합성을 안내하는 반복적인 개선 시스템을 도입했습니다.
•
한 아키텍처의 레퍼런스 구현이 다른 하드웨어 타겟에 대한 생성 품질을 크게 향상시키는 크로스 플랫폼 지식 이전을 효과적으로 활용함을 입증했습니다.
•
NVIDIA CUDA 및 Apple Metal과 같이 근본적으로 다른 병렬 컴퓨팅 플랫폼에서 효과적인 프로그램 합성을 시연하여 플랫폼 독립적인 접근 방식의 유효성을 검증했습니다.