Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

TITAN: Query-Token based Domain Adaptive Adversarial Learning

Created by
  • Haebom

作者

Tajamul Ashraf, Janibul Bashir

概要

この論文は、ソースデータなしでターゲットドメインに適応する必要があるソースレスドメイン適応オブジェクト検出(SF-DAOD)の問題に焦点を当てています。従来のアプローチのほとんどは、ソース事前学習モデルによって生成された擬似ラベルを使用して微調整する学生 - 教師(ST)フレームワークを使用した自己指向方式を使用していますが、ドメイン偏向、不一致、および大きなドメイン移動による擬似ラベルの高いノイズによって教師モデルの崩壊が発生し、学生モデルのパフォーマンスが大幅に低下するという問題があります。これを解決するために、この論文はターゲットベースの反復クエリ - トークン敵対ネットワーク(TITAN)を提案します。 TITANは、ソースに似た(簡単な)サンプルとソースに似ていない(難しい)サンプルにターゲット画像を分割し、検出分散が高いほど再現率が高く、ソースドメインとの類似性が大きいという洞察を活用して分散を推定する戦略を採用しています。さらに、2つの特徴表現間のドメイン間隔を減らすために、生徒 - 教師の基本フレームワークにクエリ - トークンベースの敵対モジュールを統合します。 4つの自然画像データセットと2つの医療データセットで実験を行った結果、TITANが従来の最先端(SOTA)方法よりも優れた性能を示すことが確認されました。 C2F、C2B、S2C、K2Cベンチマークでそれぞれ+22.7%、+22.2%、+21.1%、+3.7%のmAP向上を報告しました。

Takeaways、Limitations

Takeaways:
ソースレスドメイン適応オブジェクト検出問題に対する新しいアプローチであるTITANの提示。
擬似ラベルのノイズ問題を効果的に軽減する戦略を提示
ターゲットドメイン画像分割と分散推定による性能向上
さまざまなデータセットでSOTAパフォーマンスを達成。
Limitations:
TITANの分散推定戦略の一般化性能に関する追加研究の必要性
特定のデータセットのパフォーマンス向上が他のデータセットに一般化されない可能性。
より多様で複雑なドメインの適用性検証が必要です。
👍