यह शोधपत्र FGBench का परिचय देता है, जो 625,000 आणविक विशेषता अनुमान समस्याओं वाला एक नया डेटासेट है, जिसका उद्देश्य रसायन विज्ञान में कार्यात्मक समूह (FG) जानकारी का लाभ उठाने वाले बड़े पैमाने के भाषा मॉडल (LLM) के प्रदर्शन को बेहतर बनाना है। FGBench अणुओं के भीतर कार्यात्मक समूहों को सटीक रूप से एनोटेट और स्थानीयकृत करता है, आणविक संरचनाओं और पाठ्य विवरणों के बीच संबंध को मजबूत करता है और अधिक व्याख्यात्मक और संरचना-जागरूक LLM के विकास को सुगम बनाता है। यह तीन श्रेणियों (एकल-कार्यात्मक समूह प्रभाव, बहु-कार्यात्मक समूह अंतःक्रियाएँ, और प्रत्यक्ष आणविक तुलना) में 245 विभिन्न कार्यात्मक समूहों के लिए समाश्रयण और वर्गीकरण कार्यों को सम्मिलित करता है। अत्याधुनिक LLM के बेंचमार्क परिणाम दर्शाते हैं कि वर्तमान LLM कार्यात्मक समूह स्तर पर विशेषता अनुमान लगाने में संघर्ष करते हैं। FGBench पद्धति से कार्यात्मक समूह-स्तरीय जानकारी के साथ नए प्रश्न-उत्तर युग्म बनाने के लिए एक आधार के रूप में कार्य करने की उम्मीद है, जिससे LLM सूक्ष्म आणविक संरचना-गुण संबंधों को बेहतर ढंग से समझ सकेंगे। डेटासेट और मूल्यांकन कोड GitHub पर सार्वजनिक रूप से उपलब्ध हैं।