Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

JALMBench: Benchmarking Jailbreak Vulnerabilities in Audio Language Models

Created by
  • Haebom

作者

Zifan Peng, Yule Liu, Zhen Sun, Mingchen Li, Zeren Luo, Jingyi Zheng, Wenhan Dong, Xinlei He, Xuechao Wang, Yingjie Xue, Shengmin Xu, Xinyi Huang

概要

オーディオ言語モデル(ALM)の安全性を評価するための包括的なベンチマークであるJALMBenchを紹介します。 JALMBenchは、11,316のテキストサンプルと245,355のオーディオサンプル(1,000時間以上)を含むデータセットを含み、12の主要ALM、4つのテキストベースの攻撃方法、4つのオーディオベースの攻撃方法、5つの防御方法をサポートします。 JALMBenchを使用して、攻撃効率、トピック感度、音声多様性、アーキテクチャの詳細な分析を提供し、プロンプトとレスポンスレベルで攻撃軽減戦略を探求します.

Takeaways、Limitations

Takeaways:
ALMに対する潜在的なセキュリティ脆弱性の特定に貢献
さまざまな攻撃方法と防御戦略を比較および評価するための統合フレームワークを提供します。
ALMの安全性を向上させるための研究方向の提示。
Limitations:
不明(論文の要約でLimitations記載されていない).
👍