本研究评估了超参数优化对提升轻量级卷积网络和基于Transformer的网络实时图像分类性能的影响。七种最先进的轻量级架构,包括ConvNeXt-T、EfficientNetV2-S、MobileNetV3-L、MobileViT v2 (S/XS)、RepVGG-A2和TinyViT-21M,在来自ImageNet-1K数据集的90,000张平衡图像子集上进行训练。在标准化训练环境中,研究了学习速率调度、数据增强、优化器和初始化等超参数对模型性能的影响,并使用NVIDIA L40s GPU以1,512的批量大小执行推理基准测试,以测量实时条件下的延迟和吞吐量。仅超参数调整就使 Top-1 准确率比基线提高了 1.5-3.5%,而 RepVGG-A2 和 MobileNetV3-L 等模型实现了低于 5 毫秒的延迟和每秒超过 9,800 帧的吞吐量,证明了它们适合边缘部署。