POINT² (POlymer INformatics Training and Testing)는 중합체 정보학 분야의 표준화된 워크플로우 부재 문제를 해결하기 위해 고안된 종합적인 벤치마크 데이터베이스 및 프로토콜입니다. 기존의 라벨이 지정된 데이터셋과 약 100만 개의 가상 중합체를 포함하는 비라벨 데이터셋 PI1M을 활용하여, 양자화된 랜덤 포레스트, 드롭아웃을 사용한 다층 퍼셉트론, 그래프 신경망, 사전 훈련된 대규모 언어 모델 등 다양한 머신러닝 모델 앙상블을 개발했습니다. 모건, MACCS, RDKit, 위상, 원자 쌍 지문 및 그래프 기반 기술자와 같은 다양한 중합체 표현과 결합하여 기체 투과성, 열전도도, 유리 전이 온도, 녹는점, 자유 체적 분율, 밀도 등 다양한 특성에 대한 특성 예측, 불확실성 추정, 모델 해석성 및 템플릿 기반 중합 합성 가능성을 달성합니다. POINT² 데이터베이스는 중합체 발견 및 최적화를 위한 중합체 정보학 커뮤니티에 귀중한 자원으로 활용될 수 있습니다.