この論文では、大規模ビジョン言語モデル(LVLM)がデジタル測定装置(DMD)の値を読み取るという単純な作業で困難になる現実の問題を解決するために、合成データ生成ツールCAD2DMD-SETを提案します。 CAD2DMD-SETは、3D CADモデル、高度なレンダリング、高忠実度画像合成を活用して、さまざまなVQAラベル付き合成DMDデータセットを生成し、実際の環境の制約を評価するための検証セットDMDBenchも付属しています。 3つの最先端LVLMを対象に評価した結果、CAD2DMD-SETで追加学習したモデルの性能が大幅に向上し、特にInternVLは200%の性能向上を示した。 CAD2DMD-SETは今後オープンソースで公開される予定です。