본 논문은 FPGA 구현을 위한 HDL 코드 생성에서 LLMs의 활용에 초점을 맞추고 있습니다. 기존의 LLM 기반 코드 생성 벤치마크가 기능적 정확성에만 치중하는 한계를 지적하며, 하드웨어 자원 사용량을 고려한 새로운 벤치마크 ResBench를 제안합니다. ResBench는 12개 카테고리에 걸쳐 56개의 문제를 포함하며, 유한 상태 머신부터 금융 컴퓨팅까지 다양한 FPGA 애플리케이션을 다룹니다. 오픈소스 평가 프레임워크를 통해 Verilog 코드 생성, 정확성 검증, 자원 사용량 측정을 자동화하여 LLM 간의 자원 최적화 능력 차이를 평가합니다. 특히 LUT 사용량 분석을 통해 LLM 간의 성능 차이를 명확히 보여줍니다.