SALAD: Systematic Assessment of Machine Unlearning on LLM-Aided Hardware Design
작성자
Haebom
저자
Zeng Wang, Minghao Shao, Rupesh Karn, Likhitha Mankali, Jitendra Bhandari, Ramesh Karri, Ozgur Sinanoglu, Muhammad Shafique, Johann Knechtel
개요
본 논문은 대규모 언어 모델(LLM)을 활용한 하드웨어 설계 자동화, 특히 Verilog 코드 생성에서의 데이터 보안 문제를 다룬다. LLM을 이용한 Verilog 코드 생성은 Verilog 평가 데이터 오염, 지적 재산(IP) 설계 유출, 악성 Verilog 코드 생성 위험 등의 심각한 데이터 보안 문제를 야기할 수 있다. 이에 본 논문에서는 머신 언러닝(machine unlearning) 기법을 활용하여 이러한 위협을 완화하는 포괄적인 평가 방법인 SALAD를 제시한다. SALAD는 재훈련 없이 오염된 벤치마크, 민감한 IP 및 설계 아티팩트, 악성 코드 패턴을 사전 훈련된 LLM에서 선택적으로 제거할 수 있다. 본 논문은 상세한 사례 연구를 통해 머신 언러닝 기법이 LLM 기반 하드웨어 설계에서 데이터 보안 위험을 효과적으로 줄이는 것을 보여준다.
시사점, 한계점
•
시사점:
◦
머신 언러닝을 활용하여 LLM 기반 하드웨어 설계 자동화에서의 데이터 보안 위험을 효과적으로 완화할 수 있는 새로운 방법 제시.