Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Rethinking and Exploring String-Based Malware Family Classification in the Era of LLMs and RAG

Created by
  • Haebom

作者

Yufan Chen, Daoyuan Wu, Juantao Zhong, Zicheng Zhang, Debin Gao, Shuai Wang, Yingjiu Li, Ning Liu, Jiachi Chen, Rocky KC Chang

概要

本稿では、大規模言語モデル(LLM)と検索拡張生成(RAG)技術を活用してマルウェアの家族分類の可能性を探ります。特に、家族固有の特定の文字列(FSS)機能をRAGと同様の方法で使用して分類を実行する方法を検討します。 67個のマルウェアファミリーから4,347個のサンプルを含む評価フレームワークを開発し、2,500万個以上の文字列を抽出および分析し、主要4個のモジュールの設計選択の詳細な除去研究を通じて、各モジュールで8.1%から120%までの相対的改善を確認した。

Takeaways、Limitations

Takeaways:
LLMおよびRAG技術を活用してマルウェアファミリー分類精度の向上の可能性を提示します。
FSSベースの分類方式の有効性を実証
様々なモジュール設計の選択による性能変化を分析することによって最適化方向を提示
Limitations:
論文の内容だけでは具体的な技術的限界や改善方向に関する情報不足。
評価フレームワークの詳細情報(例:データセット構成、実験設定など)は限られています。
実際の環境での適用性と拡張性に関するさらなる研究が必要
👍