ai-workers
🗣️자유게시판
정치이야기, 사적인이야기 빼고 자유롭게!
Topic
Created by
Activity
Untitled
Y
yuanqing zhu
Jul 10, 2025
Untitled
디오
Mar 19, 2025
Untitled
소리그림
Mar 18, 2025
Untitled
소리그림
Mar 18, 2025
Untitled
2
디오
Mar 18, 2025
Untitled
디오
Mar 17, 2025
Untitled
디오
Mar 16, 2025
Untitled
디오
Mar 16, 2025
Untitled
1
1
디오
Mar 15, 2025
Untitled
1
1
디오
Mar 15, 2025
Untitled
디오
Mar 1, 2025
Untitled
디오
Feb 27, 2025
Untitled
디오
Feb 27, 2025
Untitled
1
디오
Feb 26, 2025
Untitled
디오
Feb 26, 2025
Untitled
디오
Feb 26, 2025
Untitled
6
5
AUBE BIJOU
Feb 19, 2025
Untitled
2
3
디오
Feb 18, 2025
Untitled
2
3
디오
Feb 16, 2025
Untitled
1
디오
Feb 14, 2025
Load more
ai-workers
AI WORKERS
🗣️자유게시판
yuli
Jan 24, 2025
1y ago
Created by
yuli
Created at
Jan 24, 2025 9:34 AM
Category
Empty
URL
Empty
Activity
Jan 27, 2025
Text
Empty
어제 중국에서 새로운 AI 추론 모델이 나왔어요.
수학, 코드, 추론 작업에서 OpenAI의 o1 모델과 유사한 성능을 보인다고 합니다.
https://github.com/deepseek-ai/DeepSeek-R1?utm_source=www.superpowerdaily.com&utm_medium=newsletter&utm_campaign=project-stargate-a-500b-ai-infrastructure-initiative&_bhlid=b274be7e50a13fc26e06abab38d17a5d2c8c6c8e
DeepSeek-R1 시리즈 모델 소개
1. DeepSeek-R1-Zero
•
훈련 방식:
대규모 강화 학습(RL)만으로 훈련되었으며, 감독 학습(SFT)을 사전 단계로 사용하지 않음.
•
성능:
뛰어난 추론 성능을 보였으나, 일부 문제점도 있음.
•
문제점:
무한 반복, 낮은 가독성 , 언어 혼합 등
•
2. DeepSeek-R1
•
개선된 점:
RL 이전에 콜드 스타트 데이터를 통합하여 성능을 개선.
•
성능:
DeepSeek-R1은 수학, 코드, 추론 작업에서 OpenAI의 o1 모델과 유사한 성능을 보임.
•
목표:
RL의 한계를 극복하고 더욱 향상된 추론 성능을 제공.
오픈 소스 공개 및 지원
DeepSeek는 연구 커뮤니티 지원을 위해 여러 모델을 오픈 소스로 공개함.
•
공개 모델들:
◦
DeepSeek-R1-Zero
◦
DeepSeek-R1
◦
DeepSeek-R1에서 증류된 모델:
Llama와 Qwen을 기반으로 한 여섯 개의 밀집 모델.
•
특히 주목할 모델:
◦
DeepSeek-R1-Distill-Qwen-32B
는 OpenAI-o1-mini를 능가하며, 새로운 최첨단 성과를 기록.
핵심 성과
•
DeepSeek-R1-Distill-Qwen-32B
모델은 다양한 벤치마크에서
OpenAI-o1-mini
를 초과하는 성능을 보이며,
밀집 모델
분야에서 새로운 최첨단 성과를 달성.
GitHub - deepseek-ai/DeepSeek-R1
Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub.
github.com
2
3
몽환
Jan 25, 2025
요고 코딩 잘한다는 소문이있던데요.,....!
yuli
Jan 26, 2025
상당한 기대를 받고 있는 거 같아요
See latest comments