🗣️자유게시판

정치이야기, 사적인이야기 빼고 자유롭게!

Topic

Created by

Activity

Untitled

Y
yuanqing zhu

Jul 10, 2025

Untitled

디오

Mar 19, 2025

Untitled

소리그림

Mar 18, 2025

Untitled

소리그림

Mar 18, 2025

Untitled

디오

Mar 18, 2025

Untitled

디오

Mar 17, 2025

Untitled

디오

Mar 16, 2025

Untitled

디오

Mar 16, 2025

Untitled

디오

Mar 15, 2025

Untitled

디오

Mar 15, 2025

Untitled

디오

Mar 1, 2025

Untitled

디오

Feb 27, 2025

Untitled

디오

Feb 27, 2025

Untitled

디오

Feb 26, 2025

Untitled

디오

Feb 26, 2025

Untitled

디오

Feb 26, 2025

Untitled

AUBE BIJOU

Feb 19, 2025

Untitled

디오

Feb 18, 2025

Untitled

디오

Feb 16, 2025

Untitled

디오

Feb 14, 2025

AI WORKERS

🗣️자유게시판

yuli

Jan 24, 20251y ago

Created by

yuli

Created at

Jan 24, 2025 9:34 AM

DeepSeek-R1 시리즈 모델 소개

1. DeepSeek-R1-Zero

•

훈련 방식: 대규모 강화 학습(RL)만으로 훈련되었으며, 감독 학습(SFT)을 사전 단계로 사용하지 않음.

•

성능: 뛰어난 추론 성능을 보였으나, 일부 문제점도 있음.

•

문제점: 무한 반복, 낮은 가독성 , 언어 혼합 등

•

2. DeepSeek-R1

•

개선된 점: RL 이전에 콜드 스타트 데이터를 통합하여 성능을 개선.

•

성능: DeepSeek-R1은 수학, 코드, 추론 작업에서 OpenAI의 o1 모델과 유사한 성능을 보임.

•

목표: RL의 한계를 극복하고 더욱 향상된 추론 성능을 제공.

오픈 소스 공개 및 지원

DeepSeek는 연구 커뮤니티 지원을 위해 여러 모델을 오픈 소스로 공개함.

•

공개 모델들:

◦

DeepSeek-R1-Zero

◦

DeepSeek-R1

◦

DeepSeek-R1에서 증류된 모델: Llama와 Qwen을 기반으로 한 여섯 개의 밀집 모델.

•

특히 주목할 모델:

◦

DeepSeek-R1-Distill-Qwen-32B는 OpenAI-o1-mini를 능가하며, 새로운 최첨단 성과를 기록.

핵심 성과

•

DeepSeek-R1-Distill-Qwen-32B 모델은 다양한 벤치마크에서 OpenAI-o1-mini를 초과하는 성능을 보이며, 밀집 모델 분야에서 새로운 최첨단 성과를 달성.

GitHub - deepseek-ai/DeepSeek-R1

Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub.

github.com

몽환

Jan 25, 2025

요고 코딩 잘한다는 소문이있던데요.,....!

yuli

Jan 26, 2025

상당한 기대를 받고 있는 거 같아요

See latest comments