Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Can Language Models Discover Scaling Laws?

Created by
  • Haebom

저자

Haowei Lin, Haotian Ye, Wenzheng Feng, Quzhe Huang, Yujun Li, Hubert Lim, Zhengrui Li, Xiangyu Wang, Jianzhu Ma, James Zou, Yitao Liang

개요

본 논문은 모델 성능 예측을 위한 스케일링 법칙 발견의 자동화를 목표로, 기존 연구에서 수집한 5,000개 이상의 실험 데이터를 바탕으로 7가지 다양한 스케일링 법칙 발견 과제를 제시합니다. 기존 에이전트의 한계를 극복하기 위해, 진화 기반 에이전트인 SLDAgent를 개발하여 스케일링 법칙 모델과 매개변수를 공동 최적화함으로써 변수 간의 복잡한 관계를 자율적으로 탐색합니다. SLDAgent는 인간이 도출한 기존 법칙보다 일관되게 정확한 외삽 성능을 보이는 법칙을 자동으로 발견하며, 이는 사전 학습 및 미세 조정 응용 분야에서 실용적인 유용성을 보입니다. 본 연구는 AI 시스템이 자체 스케일링 동작을 이해하고 연구 커뮤니티에 새로운 지식을 제공할 수 있음을 보여주는 에이전트 기반 과학적 발견의 새로운 패러다임을 제시합니다.

시사점, 한계점

시사점:
SLDAgent는 기존의 인간 기반 스케일링 법칙보다 더 정확한 외삽 성능을 보이는 새로운 스케일링 법칙을 자동으로 발견함.
SLDAgent가 발견한 법칙은 사전 학습 및 미세 조정에 실용적으로 활용될 수 있음.
AI 시스템이 자체 스케일링 동작을 이해하고 연구에 기여할 수 있는 새로운 가능성을 제시함.
에이전트 기반 과학적 발견의 새로운 패러다임을 제시함.
한계점:
논문에 명시된 한계점은 없음. (논문 요약 내용에서 직접적으로 언급된 한계점은 없음)
👍