본 논문은 인터넷 네트워크 트래픽을 효과적으로 모델링하기 위한 사전 학습 모델 NetGPT를 제시합니다. 기존 자연어 처리 분야에서의 사전 학습 성공 사례와 달리, 네트워크 트래픽 분야에서는 이러한 시도가 부족했습니다. NetGPT는 다양한 패턴의 네트워크 트래픽을 통합된 텍스트 입력으로 변환하여 트래픽 이해 및 생성 작업 모두를 지원합니다. 헤더 필드 섞기, 패킷 분할, 다양한 작업 레이블을 프롬프트에 통합하는 등의 기법을 통해 다양한 작업에 대한 사전 학습 모델의 적응 효과를 최적화합니다. 암호화 소프트웨어, DNS, 사설 산업 프로토콜, 암호화폐 채굴 등 다양한 트래픽 데이터셋을 사용한 실험 결과, NetGPT는 트래픽 이해 및 생성 작업에서 기존 최고 성능 모델보다 훨씬 우수한 성능을 보였습니다.