본 논문은 과학적 시뮬레이션 시스템에서 물리적 정합성, 해석 가능성, 그리고 확장성을 동시에 달성하는 어려움을 해결하기 위해 SwarmThinkers라는 강화 학습 프레임워크를 제시합니다. SwarmThinkers는 원자 규모 시뮬레이션을 물리적으로 근거한 군집 지능 시스템으로 재구성하여 각 확산 입자를 공유 정책 네트워크를 통해 전이를 선택하는 지역적 의사결정 에이전트로 모델링합니다. 학습된 선호도와 전이율을 융합하는 재가중치 메커니즘을 통해 통계적 정확도를 유지하면서 해석 가능한 단계별 의사결정을 가능하게 합니다. 중앙 집중식 학습과 분산 실행 패러다임을 통해 시스템 크기, 농도, 온도에 관계없이 재학습 없이 정책을 일반화할 수 있습니다. 방사선 유도 Fe-Cu 합금 석출을 시뮬레이션하는 벤치마크에서 SwarmThinkers는 단일 A100 GPU에서 전체 규모의 물리적으로 일관된 시뮬레이션을 달성한 최초의 시스템이며, 이전에는 슈퍼컴퓨터를 사용한 OpenKMC를 통해서만 가능했습니다. 최대 4963배(평균 3185배) 빠른 계산과 485배 낮은 메모리 사용량을 제공합니다. 입자를 수동적 샘플러가 아닌 의사결정자로 취급함으로써 SwarmThinkers는 에이전트 기반 지능을 통해 물리적 일관성, 해석 가능성 및 확장성을 통합하는 과학적 시뮬레이션의 패러다임 전환을 제시합니다.