Cet article évalue le risque de violation du droit d'auteur lié à la conception matérielle à l'aide de modèles de langage à grande échelle (LLM), notamment la génération de code Verilog, et présente une méthode pour le minimiser. Pour pallier la limitation de taille et l'absence de vérification de licence des jeux de données Verilog open source existants, nous proposons FreeSet, un jeu de données Verilog open source contenant plus de 220 000 fichiers avec un risque de violation du droit d'auteur minimisé, et un cadre de gestion automatisé des jeux de données. Sur cette base, nous développons FreeV, un modèle Llama optimisé pour Verilog, en construisant un cadre de réglage fin LLM grâce à un pré-entraînement continu. Les résultats expérimentaux montrent que FreeV présente un risque de violation du droit d'auteur significativement plus faible (3 %) et améliore le taux de réussite à VerilogEval de plus de 10 % par rapport aux modèles existants.