본 논문은 인간이 설계한 고정된 구조를 가진 오늘날의 AI 시스템의 한계를 극복하고, AI 자체의 발전을 자동화하는 방법으로 '다윈 괴델 머신(DGM)'을 제안합니다. DGM은 다윈의 진화론과 개방형 탐색 연구에서 영감을 받아, 자체 코드를 반복적으로 수정하고 코딩 벤치마크를 통해 각 변경 사항을 실험적으로 검증하는 자기 개선 시스템입니다. 생성된 코딩 에이전트의 아카이브를 유지하며, 기존 에이전트를 기반으로 새로운 에이전트를 생성하여 아카이브를 확장합니다. 이러한 개방형 탐색을 통해 다양하고 고품질의 에이전트를 생성하고, 다양한 탐색 경로를 병렬적으로 탐색합니다. 실험 결과, DGM은 SWE-bench에서 20.0%에서 50.0%로, Polyglot에서 14.2%에서 30.7%로 성능이 향상되었으며, 자기 개선이나 개방형 탐색이 없는 기준 모델보다 성능이 훨씬 뛰어났습니다. 모든 실험은 샌드박싱, 인간 감독 등의 안전 조치를 통해 수행되었습니다.