본 논문은 대규모 과학 및 공학 문제 해결에 필수적인 확장 안정성 Runge-Kutta (ESRK) 방법의 효율성 향상을 위한 새로운 최적화 기법을 제시한다. 기존의 수동 설계 방식이나 전수적 탐색 방식 대신, 유전 알고리즘(GA)과 강화 학습(RL)을 결합한 하이브리드 접근 방식을 통해 저 저장 용량 ESRK 방법의 휴리스틱을 자동으로 발견하고 최적화한다. GA는 탐색 공간 탐색을, RL은 휴리스틱 선택의 동적 개선을 담당하며, 4차 정확도를 유지하면서 계산 효율성을 크게 향상시킨다. 1D 및 2D Brusselator 시스템과 정상 상태 Navier-Stokes 방정식을 포함한 벤치마크 문제에 대한 실험 결과, 제안된 방법은 기존 ESRK 최적화 과정에 비해 IPOPT 실행 시간을 25% 단축시키면서 수치적 안정성과 정확도를 유지하는 것으로 나타났다. 이 연구는 고충실도 시뮬레이션의 자원 효율성을 개선하고 저 저장 용량 Runge-Kutta 방법의 적용 범위를 확장할 수 있는 잠재력을 보여준다.