어제 중국에서 새로운 AI 추론 모델이 나왔어요. - 🗣️자유게시판

🗣️자유게시판

yuli

Jan 24, 20251y ago

Created by

yuli

Created at

Jan 24, 2025 9:34 AM

DeepSeek-R1 시리즈 모델 소개

1. DeepSeek-R1-Zero

•

훈련 방식: 대규모 강화 학습(RL)만으로 훈련되었으며, 감독 학습(SFT)을 사전 단계로 사용하지 않음.

•

성능: 뛰어난 추론 성능을 보였으나, 일부 문제점도 있음.

•

문제점: 무한 반복, 낮은 가독성 , 언어 혼합 등

•

2. DeepSeek-R1

•

개선된 점: RL 이전에 콜드 스타트 데이터를 통합하여 성능을 개선.

•

성능: DeepSeek-R1은 수학, 코드, 추론 작업에서 OpenAI의 o1 모델과 유사한 성능을 보임.

•

목표: RL의 한계를 극복하고 더욱 향상된 추론 성능을 제공.

오픈 소스 공개 및 지원

DeepSeek는 연구 커뮤니티 지원을 위해 여러 모델을 오픈 소스로 공개함.

•

공개 모델들:

◦

DeepSeek-R1-Zero

◦

DeepSeek-R1

◦

DeepSeek-R1에서 증류된 모델: Llama와 Qwen을 기반으로 한 여섯 개의 밀집 모델.

•

특히 주목할 모델:

◦

DeepSeek-R1-Distill-Qwen-32B는 OpenAI-o1-mini를 능가하며, 새로운 최첨단 성과를 기록.

핵심 성과

•

DeepSeek-R1-Distill-Qwen-32B 모델은 다양한 벤치마크에서 OpenAI-o1-mini를 초과하는 성능을 보이며, 밀집 모델 분야에서 새로운 최첨단 성과를 달성.

GitHub - deepseek-ai/DeepSeek-R1

Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub.

github.com

몽환

Jan 25, 2025

요고 코딩 잘한다는 소문이있던데요.,....!

yuli

Jan 26, 2025

상당한 기대를 받고 있는 거 같아요

See latest comments