스케일링 법칙에 따르면 모델의 크기가 커질수록 성능이 향상됩니다. 최근 GPT35 Turbo, GPT4 Turbo, 그리고 최신 모델인 GPT45의 성능이 각각 30, 47, 70에 도달했습니다. 기본 모델이 개선될수록 추론 모델도 향상된다는 점이 중요하며, 사전학습이 계속해서 이 법칙을 따른다면 미래의 모델 성능에 대한 기대가 큽니다.
스케일링 법칙이 여전히 유효하다는 내용입니다 즉 모델의 크기가 커질수록 성능이 향상된다는 것을 의미하는데요 GPT35 Turbo는 GPQA에서 30를 기록했으며 GPT4 Turbo는 47 그리고 최신 모델인 GPT45는 70에 도달했습니다 우리가 주의깊게 봐야하는 내용은 기본 모델이 더 좋아질수록 추론 모델도 더 좋아진다는 사실입니다 그리고 사전학습PreTraining이 계속해서 법칙을 따른다면 앞으로 나올 o4에 대한 성능도 기대할 수 밖에 없습니다