Bài báo này so sánh và phân tích hiệu suất của các đặc trưng phổ và nhịp điệu khác nhau (phổ đồ quy mô mel, MFCC, tempogram tuần hoàn, sắc đồ STFT, sắc đồ CQT và sắc đồ CENS) trong phân loại dữ liệu âm thanh bằng mạng nơ-ron tích chập sâu (CNN). Sử dụng bộ dữ liệu ESC-50 (2.000 bản ghi âm môi trường), chúng tôi đã đo độ chính xác, độ chính xác, độ thu hồi và điểm F1 của từng đặc trưng cho phân loại cấp độ danh mục và lớp âm thanh. Các thí nghiệm được tiến hành bằng cách sử dụng quy trình học sâu đầu cuối.