OpenAI GPT-3.5 Turbo: 1백만 토큰당 $1에서 $2 사이의 비용이 발생합니다.
•
Anthropic Claude 2.1: 1백만 토큰당 $11에서 $32.70의 비용이 발생합니다.
•
Anthropic Claude Instant: 1백만 토큰당 $1.60에서 $5.50 사이의 비용이 발생합니다.
개인적으로 돌리고 있는 Llama 2 70B, 13B의 기준은 다음과 같습니다. (CUDA, A100 기준)
•
Llama 2 13B: 1백만 토큰당 $0.7에서 $1사이의 비용이 발생합니다.
•
Llama 2 70B: 1백만 토큰당 $1에서 $2 사이의 비용을 발생합니다.
MacStudio에서 CPU로 돌리는 경우는 아직 비용측정을 자세히 해보진 않았습니다. 다만 Llama2가 확실히 경제적이긴 합니다. 추론 능력에 대해선 GPT-4가 압도적 성능을 보여주지만 일반적 생성이나 인텐트 분류 정도는 충분히 가능해 보입니다. 7B는 미스트랄을 실험해 볼까 생각해주는데 뭔가 흥미가 안드네요.
좀 궁금한 것은 국내 모델들 CLOVA, 믿음, 액사원 정도는 어느 정도인지 궁금합니다. 보통 우리가 클라우드를 자체적으로 구축하면 초기 비용을 제외하고 30% 이상의 비용 절감을 경험하는데 국내는 어떤지 궁금합니다. 편하게 연락 주시면 솔직히 터놓고 이야기 해보면 좋을 것 같습니다. haebom@kakao.com
Subscribe to 'haebom'
Subscribe to my site to be the first to receive notifications and emails about the latest updates, including new posts.
Join Slashpage and subscribe to 'haebom'!