Sign In
🗣️자유게시판
yuli
Created by
  • yuli
Created at
Category
Empty
URL
Empty
Activity
Text
Empty
어제 중국에서 새로운 AI 추론 모델이 나왔어요.
수학, 코드, 추론 작업에서 OpenAI의 o1 모델과 유사한 성능을 보인다고 합니다.

DeepSeek-R1 시리즈 모델 소개

1. DeepSeek-R1-Zero
훈련 방식: 대규모 강화 학습(RL)만으로 훈련되었으며, 감독 학습(SFT)을 사전 단계로 사용하지 않음.
성능: 뛰어난 추론 성능을 보였으나, 일부 문제점도 있음.
문제점: 무한 반복, 낮은 가독성 , 언어 혼합 등
2. DeepSeek-R1
개선된 점: RL 이전에 콜드 스타트 데이터를 통합하여 성능을 개선.
성능: DeepSeek-R1은 수학, 코드, 추론 작업에서 OpenAI의 o1 모델과 유사한 성능을 보임.
목표: RL의 한계를 극복하고 더욱 향상된 추론 성능을 제공.

오픈 소스 공개 및 지원

DeepSeek는 연구 커뮤니티 지원을 위해 여러 모델을 오픈 소스로 공개함.
공개 모델들:
DeepSeek-R1-Zero
DeepSeek-R1
DeepSeek-R1에서 증류된 모델: Llama와 Qwen을 기반으로 한 여섯 개의 밀집 모델.
특히 주목할 모델:
DeepSeek-R1-Distill-Qwen-32B는 OpenAI-o1-mini를 능가하며, 새로운 최첨단 성과를 기록.

핵심 성과

DeepSeek-R1-Distill-Qwen-32B 모델은 다양한 벤치마크에서 OpenAI-o1-mini를 초과하는 성능을 보이며, 밀집 모델 분야에서 새로운 최첨단 성과를 달성.
2
👍
3
몽환
요고 코딩 잘한다는 소문이있던데요.,....!
yuli
상당한 기대를 받고 있는 거 같아요
See latest comments