Afin de pallier les limites des modèles vision-langage (VLM) permettant l'interaction en langage naturel avec l'imagerie satellitaire, cet article présente Landsat30-AU, un jeu de données vision-langage à grande échelle basé sur plus de 36 ans d'imagerie satellitaire basse résolution à long terme à 30 mètres, collectée par quatre satellites Landsat (5, 7, 8 et 9) au-dessus de l'Australie. Landsat30-AU se compose de deux éléments : Landsat30-AU-Cap, contenant 196 262 paires image-légende, et Landsat30-AU-VQA, contenant 17 725 échantillons de questions-réponses visuelles (VQA) vérifiés par l'homme dans huit domaines de télédétection. Nous démontrons que les VLM existants peinent à comprendre l'imagerie satellitaire basse résolution et démontrons des performances améliorées grâce à un réglage fin léger utilisant Landsat30-AU.