Sign In

Humains-Junior: A 3.8B Language Model Achieving GPT-4o-Level Factual Accuracy by Directed Exoskeleton Reasoning

Created by
  • Haebom
Category
Empty

저자

Nissan Yaron, Dan Bystritsky, Ben-Etzion Yaron

개요

Humans-Junior는 3.8B 모델로, FACTS Grounding 공개 부분에서 GPT-4o와 $\pm 5$ pp 내에서 동등한 성능을 보입니다. Microsoft AI Foundry 가격 기준으로 GPT-4o보다 약 19배 저렴하며, 자체 호스팅 또는 엣지 배포를 통해 추론 비용을 거의 0으로 낮출 수 있습니다. 이 모델은 최소한의 "Exoskeleton Reasoning" 스캐폴드와 프로토콜 준수를 가르치는 행동 기반 미세 조정의 조합을 사용합니다.

시사점, 한계점

3.8B 모델로 GPT-4o 수준의 FACTS 정확도를 달성했습니다.
클라우드 가격이 GPT-4o보다 약 19배 저렴합니다.
자체 호스팅/엣지 배포로 거의 제로에 가까운 비용이 가능합니다.
"Exoskeleton Reasoning"과 행동 기반 미세 조정의 시너지 효과를 확인했습니다.
제한된 벤치마크 (Q1-Q500)에 대한 결과입니다.
최전선 모델에 대한 프롬프트 전용 설정에서 향상이 있었습니다 (Q1-Q100).
Appendix E에 가격 출처, Appendix F에 추가 결과가 요약되어 있습니다.
👍