Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Assessing Tenstorrent's RISC-V MatMul Acceleration Capabilities

Created by
  • Haebom

저자

Hiari Pizzini Cavagna, Daniele Cesarini, Andrea Bartolini

개요

본 논문은 대규모 언어 모델(LLM) 서비스에 대한 수요 증가에 따라 계산 효율성과 에너지 소비를 최적화하는 특수 하드웨어 아키텍처의 필요성이 증대됨에 따라, 저정밀도 수치 연산에서 기본 선형 대수 커널에 대한 Tenstorrent Grayskull e75 RISC-V 가속기의 성능을 평가한다. Grayskull의 실행 모델, 그리드 크기, 행렬 차원, 데이터 형식 및 수치 정밀도가 계산 효율에 미치는 영향에 대한 자세한 특성 분석을 제시하며, Intel Sapphire Rapids 프로세서와 두 개의 NVIDIA GPU(V100 및 A100)를 포함한 텐서 가속 기능을 갖춘 최첨단 아키텍처와 Grayskull의 성능을 비교한다. NVIDIA GPU가 원시 성능을 지배하지만, Grayskull은 전력 소비와 계산 처리량 간의 경쟁력 있는 절충안을 보여주며, BF16에서 최대 1.55 TFLOPs/Watt에 도달한다.

시사점, 한계점

시사점: Tenstorrent Grayskull e75 가속기가 에너지 효율적인 LLM 연산을 위한 경쟁력 있는 대안임을 제시한다. 특히, BF16 정밀도에서 높은 TFLOPs/Watt 성능을 달성하여 전력 소비에 민감한 애플리케이션에 적합함을 보여준다. 최첨단 GPU와 비교 분석을 통해 성능과 전력 소비 간의 균형을 파악하는 데 도움을 준다.
한계점: NVIDIA GPU 대비 원시 성능 측면에서 열위에 있다는 점이 한계로 지적될 수 있다. 평가에 사용된 특정 선형 대수 커널에 국한된 결과이며, 더욱 다양한 LLM 작업에 대한 성능 평가가 필요하다. Grayskull의 실제 LLM 구현 및 배포 환경에서의 성능에 대한 추가 연구가 필요하다.
👍