본 논문은 과학적 시뮬레이션 시스템에서 물리적 일관성, 해석 가능성, 그리고 확장성을 동시에 달성하는 문제를 다룹니다. 기존의 운동학적 몬테카를로(Kinetic Monte Carlo) 방법은 열역학적 정확성을 보장하지만 확장성이 떨어지고, 학습 기반 방법은 효율적이지만 물리적 일관성과 해석 가능성을 희생하는 단점이 있습니다. 본 연구에서는 SwarmThinkers라는 강화 학습 프레임워크를 제시합니다. 이는 원자 규모 시뮬레이션을 물리적으로 근거한 군집 지능 시스템으로 재구성하여, 각 확산 입자를 공유 정책 네트워크를 통해 전이를 선택하는 지역적 의사결정 에이전트로 모델링합니다. 열역학적 제약 조건 하에서 훈련된 정책 네트워크와 재가중치 메커니즘을 통해 학습된 선호도와 전이율을 융합하여 통계적 정확도를 유지하면서 해석 가능한 단계별 의사결정을 가능하게 합니다. 중앙 집중식 훈련과 분산 실행 패러다임을 통해 시스템 크기, 농도, 온도에 관계없이 재훈련 없이 정책을 일반화할 수 있습니다. 방사선 유도 Fe-Cu 합금 석출 시뮬레이션 벤치마크에서 SwarmThinkers는 단일 A100 GPU에서 전체 규모의 물리적 일관성 시뮬레이션을 달성한 최초의 시스템으로, 기존의 OpenKMC를 사용한 슈퍼컴퓨터 수준의 성능을 뛰어넘습니다. 최대 4963배(평균 3185배) 빠른 계산 속도와 485배 낮은 메모리 사용량을 제공합니다. 입자를 수동적 표본 추출자가 아닌 의사결정자로 취급함으로써, SwarmThinkers는 에이전트 기반 지능을 통해 물리적 일관성, 해석 가능성, 확장성을 통합하는 과학적 시뮬레이션의 패러다임 전환을 제시합니다.