본 논문은 신경망(NN)의 파라미터 획득을 위한 새로운 방법으로, 대규모 언어 모델(LLM)을 활용하는 NeuroGen을 제안합니다. NeuroGen은 데이터, 작업, 네트워크 구조에 대한 설명을 조건으로 NN 파라미터를 생성하는 두 단계 접근 방식입니다. 1단계는 LLM을 NN 체크포인트로 사전 훈련하여 파라미터 공간에 대한 기본적인 이해를 구축하는 파라미터 참조 지식 주입이고, 2단계는 풍부하고 작업 중심적인 프롬프트를 통해 LLM이 특정 작업에 적응하도록 하는 컨텍스트 향상 지시 조정입니다. 실험 결과, NeuroGen이 사용 가능한 NN 파라미터를 효과적으로 생성함을 보여줍니다.