AI 과학자-v2, 최초로 동료 평가 학술 논문 발표 성공
핵심 요약 • AI 과학자-v2가 생성한 논문이 ICLR 2025 워크숍에서 동료 평가 과정 통과 • 인간 개입 없이 완전 AI 생성된 최초의 공식 학술 논문 • 3개 제출 논문 중 1개 통과 (평균 점수 6.33, 상위 45%) • 브리티시 컬럼비아 대학, 옥스포드 대학, Sakana AI 공동 연구 • 논문 제목: "Compositional Regularization: Unexpected Obstacles in Enhancing Neural Network Generalization" AI 과학자가 여는 과학 연구의 새 시대 획기적 성과, AI 생성 논문의 학계 인정 2025년 3월 12일, 과학계에 역사적인 사건이 발생했다. AI 과학자-v2(The AI Scientist-v2)가 생성한 논문이 ICLR이라는 최상위 AI 컨퍼런스 워크숍에서 동료 평가(peer-review) 과정을 통과한 것이다. 이는 인간 과학자들이 거치는 것과 동일한 검증 과정을 통과한 최초의 완전 AI 생성 논문으로, 과학 연구 방식의 변화를 보여주는 중요한 이정표가 되었다. 철저한 평가 프로세스 연구팀은 ICLR 워크숍 조직위원회와 협력하여 3개의 AI 생성 논문을 제출했다. 심사위원들은 일부 논문이 AI에 의해 생성되었을 가능성(43개 중 3개)에 대해 알고 있었으나, 자신이 평가하는 특정 논문이 AI 생성인지는 알 수 없었다. 가장 중요한 점은 AI 과학자-v2가 모든 과정을 독립적으로 수행했다는 것이다. 과학적 가설 설정부터 실험 설계, 코드 작성, 실험 실행, 데이터 분석, 시각화, 논문 작성까지 모든 단계를 AI가 완수했다. 인간 연구자들은 광범위한 연구 주제만 제시하고 제출할 논문을 선택했을 뿐이다. 제출된 3개 논문 중 2개는 통과 기준에 미치지 못했으나, "Compositional Regularization: Unexpected Obstacles in Enhancing Neural Network Generalization"이라는 제목의 논문은 평균 점수 6.33을 받아 통과했다. 이 점수는 워크숍에서 채택된 다수의 인간 작성 논문보다 높은 수준이었다. 투명성과 윤리적 지침의 중요성 연구팀은 이 실험의 모든 과정에서 투명성을 최우선으로 했다. ICLR 리더십과 워크숍 조직위원회의 전적인 협력 하에 진행되었으며, 브리티시 컬럼비아 대학에서 IRB 승인을 받았다. 또한 사전 합의에 따라, AI 생성 논문이 평가를 통과하더라도 출판 전 철회하기로 결정했다. 이는 AI 생성 연구물을 기존 학술지에 게재할지에 대한 과학계의 합의가 아직 이루어지지 않았기 때문이다. 현재의 한계와 미래 전망 연구팀이 자체 평가한 결과, 3개 논문 모두 ICLR 메인 컨퍼런스 수준에는 아직 미치지 못했다. 워크숍(채택률 60-70%)은 메인 컨퍼런스(채택률 20-30%)보다 진입 장벽이 낮다는 점을 감안할 필요가 있다. 그러나 이는 시작에 불과하다. AI 과학자는 최신 대규모 언어 모델을 기반으로 하며, 기반 모델이 발전할수록 함께 개선될 것으로 예상된다. 연구팀은 미래에는 AI가 인간 수준을 넘어서는 논문을 생성할 수 있을 것으로 전망한다. 궁극적으로 중요한 것은 AI 과학이 인간 과학과 어떻게 비교되는가가 아니라, AI의 발견이 질병 치료나 우주의 법칙에 대한 지식 확장과 같은 인류의 번영에 어떻게 기여하는가이다. 이 획기적인 연구는 브리티시 컬럼비아 대학의 Cong Lu와 Jeff Clune, 옥스포드 대학의 Chris Lu와 Jakob Foerster, 그리고 Sakana AI와의 협력으로 진행되었으며, AI가 과학 연구 방식을 어떻게 변화시킬지에 대한 중요한 사례를 제시하고 있다. /구
- 콘텐주콘