본 논문은 지구 관측 위성 스케줄링 문제(AEOSSP)에 대한 심층 강화 학습(DRL) 기반 접근 방식을 제시한다. AEOSSP는 위성 궤도를 따라 관측 목표의 부분 집합을 스케줄링하는 문제로, 시간, 에너지, 메모리 제약 조건을 충족해야 한다. 본 논문에서는 구름 가림, 대기 난류, 영상 해상도 등 영상 품질 저하 요소들을 통합하여 에너지 및 메모리 자원 사용을 최적화하는 DRL 방법을 제안한다. 제안된 방법은 목표물 순서 선택 및 각 목표물에 대한 최적 관측 시간 결정이라는 이중 의사결정 과정을 포함한다. 실험 결과, 제안된 알고리즘은 품질 요구 사항을 충족하지 못하는 영상 캡처를 60% 이상 줄이고, 자세 조정으로 인한 에너지 낭비를 최대 78%까지 감소시키는 동시에 강력한 관측 성능을 유지하는 것으로 나타났다.