Vision-Language Model(VLM)が分散DNN環境で中間特徴をクラウドに転送するときに発生するセマンティック情報漏洩のリスクを解決するために、本論文は、画像再構成ではなく中間特徴から直接高レベルのセマンティックコンテンツ(例えば、ラベル、キャプション)を回復するクロスモダリティ逆転フレームワークであるCapRecoverを提案する。 CapRecoverは、さまざまなデータセットとモデルで優れた性能を示し、ラベル精度92.71%(CIFAR-10)とROUGE-Lスコア0.52(COCO2017のResNet50の特徴で作成されたキャプション)を達成しました。さらに、深い畳み込み層が浅い層よりもセマンティックな情報を多く符号化することを確認した。セマンティック情報漏洩緩和のために、各層の中間特徴にランダムノイズを追加し、次の層から除去する簡単な保護方法を提案し、追加の訓練費用なしで流出を防止できることを実験的に立証した。