본 논문은 두 광자 중합 (TPP)을 위한 차세대 광개시제 개발을 가로막는, 광분해 및 여기 상태 거동 모델링에 필요한 양자 화학 및 광물리적 특성을 포함하는 대규모 공개 데이터세트 부족 문제를 해결하고자 한다. 이를 위해, TPA 단면적, TPA 스펙트럼 범위, 단일항-삼중항 계통간 전이(ISC) 에너지, 독성 및 합성 가능성 점수, 친수성, 용해도, 끓는점, 분자량, 방향족성 등 11가지 양자 화학적 특성으로 주석 처리된 200,000개 이상의 유기 분자 대규모 데이터세트인 QuantumChem-200K를 소개한다. 이 데이터는 DFT, 반경험 여기 상태 방법, 원자론적 양자 솔버 및 신경망 예측기를 통합한 하이브리드 워크플로우를 사용하여 계산되었다. QuantumChem-200K를 사용하여 오픈 소스 Qwen2.5-32B 대규모 언어 모델을 미세 조정하여 SMILES로부터 전방향 특성 예측이 가능한 화학 AI 어시스턴트를 만들었다. VQM24 및 ZINC20의 3000개 분자에 대한 벤치마킹을 통해 도메인별 미세 조정이 GPT-4o, Llama-3.1-70B, 기본 Qwen2.5-32B 모델보다 특히 광개시제 설계에 중요한 TPA 및 ISC 예측에서 정확도를 크게 향상시킴을 보여준다. QuantumChem-200K와 해당 AI 어시스턴트는 고 처리량, LLM 기반 광개시제 스크리닝 및 광감성 물질의 가속화된 발견을 위한 최초의 확장 가능한 플랫폼을 제공한다.