ToxiMol은 다양한 독성 메커니즘과 세분성을 가진 560개의 대표적인 독성 분자를 포함하는 11가지 주요 작업으로 구성된 표준화된 데이터 세트를 사용하여 다목적 다중 모드 대규모 언어 모델(MLLM)을 위한 최초의 벤치마크 작업입니다. 본 논문은 분자 독성 수정에 초점을 맞춘 ToxiMol을 소개하며, 전문가 독성학 지식을 바탕으로 메커니즘 인식 및 작업 적응 기능을 갖춘 프롬프트 주석 파이프라인을 설계했습니다. 또한 독성 종말점 예측, 합성 접근성, 약물 유사성 및 구조적 유사성을 고 처리량 평가 체인에 통합하는 자동화된 평가 프레임워크인 ToxiEval을 제안합니다. 거의 30개의 주류 다목적 MLLM을 체계적으로 평가하고, 평가 기준, 후보 다양성 및 실패 귀인과 같은 주요 요소를 분석하기 위한 여러 가지 제거 연구를 설계했습니다. 실험 결과에 따르면 현재 MLLM은 여전히 이 작업에 상당한 어려움을 겪고 있지만, 독성 이해, 의미 제약 준수 및 구조 인식 분자 편집에서 유망한 기능을 보여주기 시작했습니다.