Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

CoTox: Chain-of-Thought-Based Molecular Toxicity Reasoning and Prediction

Created by
  • Haebom

저자

Jueon Park, Yein Park, Minju Song, Soyon Park, Donghyeon Lee, Seungheun Baek, Jaewoo Kang

개요

CoTox는 약물 독성 예측을 위한 새로운 프레임워크로, 대규모 언어 모델(LLM)과 사고연쇄(CoT) 추론을 통합하여 해석 가능한 다중 독성 예측을 생성합니다. 화학 구조 데이터, 생물학적 경로, 유전자 온톨로지(GO) 용어를 결합하여 단계별 추론을 통해 독성을 예측합니다. GPT-4o를 사용한 실험 결과, 기존의 기계 학습 및 심층 학습 모델보다 성능이 우수하며, IUPAC 이름으로 화학 구조를 표현하는 것이 SMILES보다 모델의 추론 능력과 예측 성능을 향상시킨다는 것을 확인했습니다. 세포 유형에 대한 약물 치료를 시뮬레이션하고 생물학적 맥락을 CoTox 프레임워크에 통합하여 실제 약물 개발에 대한 유용성을 보여주는 사례 연구를 제시합니다.

시사점, 한계점

시사점:
LLM과 CoT 추론을 이용하여 해석 가능한 다중 독성 예측이 가능함을 보여줌.
기존 모델보다 향상된 약물 독성 예측 성능을 달성.
IUPAC 이름을 사용하여 화학 구조를 표현함으로써 모델의 추론 능력 및 예측 성능 향상.
생물학적 맥락을 통합하여 생리적 반응과 일치하는 독성 예측 생성.
초기 단계 약물 안전성 평가에 LLM 기반 프레임워크의 잠재력을 강조.
한계점:
본 연구에서 사용된 LLM의 특정 버전(GPT-4o)에 대한 의존성. 다른 LLM에 대한 일반화 성능 검증 필요.
사용된 데이터셋 및 사례 연구의 일반화 가능성에 대한 추가적인 검증 필요.
실제 약물 개발 환경에서의 CoTox 적용에 대한 추가적인 연구 필요.
LLM의 블랙박스 성격으로 인해, 추론 과정의 완벽한 해석 가능성 보장 어려움.
👍