강화 학습(RL) 기반의 저전력 마이크로컨트롤러를 사용한 제어 환경에서의 적응형 조명 제어 전략 제시. 모델 프리 Q-learning 알고리즘을 구현하여 광 의존성 저항(LDR) 센서의 실시간 피드백을 기반으로 LED 밝기를 동적으로 조정. 13개의 서로 다른 조도 레벨(L1~L13)에서 안정화되도록 학습되었으며, 각 목표는 LDR 판독값에서 파생된 64-상태 공간 내의 특정 범위에 해당. 총 130회의 시행(각 목표 레벨당 10회 에피소드) 수행. 수렴 속도, 단계 수, 목표 상태 도달 시간 측면에서 성능 평가. 훈련 시간 및 학습 효율의 분포를 분석하기 위해 상자 그림 및 히스토그램 생성. 환경 교란 존재 시에도 최소한의 오버슈팅과 부드러운 수렴을 통해 에이전트가 다양한 조도 레벨에서 효과적으로 학습하여 안정화됨을 실험적으로 검증. 에너지 효율적인 조명 제어를 위한 경량, 온디바이스 RL의 가능성을 강조하고, 자원 제약적 농업 시스템에서 다중 모드 환경 제어 응용 프로그램의 기반 마련.