यह शोधपत्र प्राकृतिक भाषा प्रसंस्करण (एनएलपी) में सफल बड़े पैमाने पर भाषा मॉडल (एलएलएम) प्रतिमान को जैविक भाषाओं (प्रोटीन, आरएनए, डीएनए) के मॉडलिंग में लागू करने की क्षमता और सीमाओं का पता लगाता है। जैविक अनुक्रमों के मॉडलिंग के लिए एनएलपी में उपयोग किए जाने वाले ऑटोरिग्रैसिव जनरेटिव प्रतिमान और मूल्यांकन मेट्रिक्स को लागू करने वाले पिछले अध्ययनों की समीक्षा करके, हम प्राकृतिक और जैविक भाषाओं के बीच अंतर्निहित संरचनात्मक सहसंबंधों में अंतर को उजागर करते हैं। इस शोधपत्र में, हम वाक्यों की शब्दार्थ सामग्री के रूप में जैव अणुओं की त्रि-आयामी संरचना पर विचार करते हैं और अवशेषों या आधारों के बीच मजबूत सहसंबंधों पर विचार करके संरचनात्मक मूल्यांकन के महत्व पर जोर देते हैं, और जैविक भाषाओं के मॉडलिंग के लिए ऑटोरिग्रैसिव प्रतिमान के संभावित अनुप्रयोग को दिखाते हैं। संबंधित कोड github.com/zjuKeLiu/RiFold में पाया जा सकता है।