Cet article propose GenTorrent, une superposition de services LLM exploitant les ressources informatiques des participants distribués. Cette solution vise à relever les défis de l'évolutivité liés à la mise à disposition de modèles linguistiques à grande échelle (LLM) open source et rentables, notamment ceux rencontrés par les petites organisations et les particuliers qui déploient et testent des innovations LLM. Inspiré des réseaux peer-to-peer, GenTorrent répond à quatre questions de recherche fondamentales : la configuration du réseau de superposition, la confidentialité des communications LLM, la distribution de superpositions économes en ressources et la vérification de la qualité de service. Les résultats de l'évaluation d'un prototype implémenté sur un ensemble de nœuds distribués démontrent que GenTorrent réduit la latence de plus de 50 % par rapport à une conception de base sans distribution de superposition, tandis que ses fonctionnalités de sécurité n'entraînent qu'une surcharge négligeable en termes de latence et de débit de service. Cette recherche suggère une nouvelle voie pour démocratiser et faire évoluer les futures capacités de service d'IA.