Cet article explore le potentiel et les limites de l'application du paradigme du modèle de langage à grande échelle (LLM) en traitement automatique du langage naturel (TALN) à la modélisation des langages biologiques (protéines, ARN, ADN). En passant en revue les études antérieures appliquant le paradigme génératif autorégressif et les mesures d'évaluation utilisées en TALN à la modélisation de séquences biologiques, nous mettons en évidence les différences de corrélations structurelles inhérentes entre les langages naturels et biologiques. Dans cet article, nous considérons la structure tridimensionnelle des biomolécules comme le contenu sémantique des phrases et soulignons l'importance de l'évaluation structurelle en considérant les fortes corrélations entre résidus ou bases, et démontrons l'application potentielle du paradigme autorégressif à la modélisation des langages biologiques. Le code correspondant se trouve dans github.com/zjuKeLiu/RiFold.