每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

超参数优化对实时图像分类轻量级深度模型的影响分析

Created by
  • Haebom

作者

Vineet Kumar Rakesh、Soumya Mazumdar、Tapas Samanta、Hemendra Kumar Pandey、Amitabha Das

大纲

本研究评估了超参数优化对提升轻量级卷积网络和基于Transformer的网络实时图像分类性能的影响。七种最先进的轻量级架构,包括ConvNeXt-T、EfficientNetV2-S、MobileNetV3-L、MobileViT v2 (S/XS)、RepVGG-A2和TinyViT-21M,在来自ImageNet-1K数据集的90,000张平衡图像子集上进行训练。在标准化训练环境中,研究了学习速率调度、数据增强、优化器和初始化等超参数对模型性能的影响,并使用NVIDIA L40s GPU以1,512的批量大小执行推理基准测试,以测量实时条件下的延迟和吞吐量。仅超参数调整就使 Top-1 准确率比基线提高了 1.5-3.5%,而 RepVGG-A2 和 MobileNetV3-L 等模型实现了低于 5 毫秒的延迟和每秒超过 9,800 帧的吞吐量,证明了它们适合边缘部署。

Takeaways, Limitations

Takeaways:
我们证明超参数调整对轻量级 CNN 和 Transformer 主干网中的收敛动态有显著影响。
调整后模型准确率提高了 1.5-3.5%。
某些模型(例如 RepVGG-A2、MobileNetV3-L)表现出适合边缘环境的性能。
提供基于可重现子集的轻量级超参数调整的见解。
Limitations:
论文中没有直接提及 Limitations(但是,研究范围仅限于 ImageNet-1K 数据集的特定子集)。
👍