DeepSeek로 피리 부는 사람들
TL;DR 시장에 존재하는 과도한 공포나 “패권 상실”이라는 식의 극단적 서사는 무엇보다 AI 생태계의 ‘복합적 현실’을 간과하고 있습니다. 중국이 내놓는 모델들의 가성비와 새로운 접근에서 배울 점은 많고, 미국이 앞서가고 있는 초거대 모델 연구와 컴퓨팅 인프라 역시 무시할 수 없습니다. 결국 기술적·사업적 융합이 지속되면서, 양국의 AI 경쟁력이 함께 성장할 가능성도 있습니다. 사실에 근거한 균형 잡힌 이해가 필요하다는 점을 강조하고 싶습니다. “중국의 AI 패권이 미국을 넘어섰다”는 주장은 지나친 과장 중국은 일찍부터 AI 역량을 보유해 왔으나, 미국 빅테크(OpenAI, Meta, Google, xAI 등)도 세계적으로 독보적인 연구개발 인프라와 다양한 AI 생태계를 갖추고 있습니다. 자율주행, 컴퓨터 비전, 영상 AI 등에서 중국 기업이 빠르게 따라붙고 있으며 DeepSeek 같은 스타트업도 혁신적인 모델을 내놓은 것은 사실입니다. 그러나 이는 “미국이 뒤처진다”거나 “패권이 완전히 이동한다”*고 단정할 근거가 되지는 않습니다. 예컨대, GPT-4o/o1나 Gemini, LLaMA3.2 등은 여전히 높은 성능을 유지하며 전 세계적으로 사용·실험되고 있습니다. 애초에 DeepSeek도 Pytorch나 LLaMA 등 Meta의 오픈소스 정책에서 수혜를 받았습니다. 실제로 Meta나 xAI 등도 Meta AI, Grok과 같은 유의미한 성능을 가진 모델과 서비스를 냈는데 뭔가 이렇게 화제가 되는 모델의 기준이 무엇인지도 궁금합니다. 결론: 중국이 AI 분야에서 계속 강력한 경쟁력을 보여주고 있지만, 이는 미·중 간 경쟁 구도가 더 치열해졌음을 의미하지, 한쪽이 일방적으로 이긴다는 의미는 아닙니다. “빅테크의 천문학적 투자(capex)는 낭비”라는 주장도 단순화된 시각 미국 빅테크들이 대규모 자본 투자를 통해 쌓아온 HPC(High-Performance Computing) 인프라, 클라우드 생태계, GPU 대량 보유 등은 초거대 모델 트레이닝과 전 세계 서비스 확장을 가능케 했습니다. DeepSeek, Qwen, TONGYI 등의 모델이 상대적으로 적은 비용으로도 충분한 성능을 낼 수 있게 된 것은 사실이나, 이는 다양한 최적화 전략(MoE, RL, Distillation 등)을 활용했기 때문입니다. 오픈소스 모델과 결합하거나 LoRA(Low-Rank Adaptation)와 같은 기법을 통해 추가적인 파인튜닝을 빠르게 적용할 수도 있습니다. 사실 23년부터 꾸준히 중국 인공지능에 대해 강조했는데 별로 관심을 못 받았습니다. 재밌는 것은 3blocks에서도 제일 인기 많은 모델 LLaMA 계열인데 저는 Qwen을 밀었는데 중국 모델이라는 이유로 선택을 많이 못 받았습니다. 저희 3blocks는 Local에 설치하는 폐쇄형 모델만 공급하는데도 말이죠. 대규모 투자 자체가 ‘낭비’였다고 볼 수 없고, 다른 접근법들도 점차 속속 등장하며 “투자 효율”이 높아지는 흐름 속에서 각 기업들이 서로 다른 방식으로 경쟁을 이어가는 것입니다. 결론: 수십억 달러 이상의 투자로 쌓아 온 미국 빅테크의 리소스와 노하우는 여전히 유효합니다. “중국이 더 적은 비용으로 해냈으니 미국 투자는 다 낭비”라는 식의 이분법은 과도한 해석입니다. “스케일링 법칙은 틀렸고, 다른 방법이 대세”라는 말 오도에 가까움
3
6