Cet article soutient que les progrès de la technologie des deepfakes audio présentent de sérieux risques pour la sécurité, la confidentialité et la confiance dans les communications numériques, ainsi que pour les avantages qu'ils apportent. Les bases de données existantes pour la détection des deepfakes audio présentent des limites : elles manquent d'accents ethniques diversifiés, ce qui les rend difficiles à appliquer en situation réelle. De plus, leurs performances de détection sont particulièrement faibles dans les contextes linguistiques et culturels d'Asie du Sud. Dans cette étude, nous présentons l'ensemble de données IndieFake (IFD), qui contient 27,17 heures de données audio réelles et deepfakes provenant de 50 Indiens anglophones. L'IFD fournit une distribution équilibrée des données et des informations sur les caractéristiques des locuteurs, et nous comparons ses performances à celles des bases de données existantes, ASVspoof21 (DF) et In-The-Wild (ITW). Nous démontrons que l'IFD surpasse ASVspoof21 (DF) et est plus exigeant que l'ensemble de données ITW sur un seul benchmark. L'ensemble de données est accessible au public à des fins de recherche.