Sign In
[2단계]AI 도구 탐색하기

대표 AI 도구 비교 : ChatGPT vs Claude vs Gemini

toolly
Category
  1. llm
  2. chatgpt
  3. claude
  4. gemini

ChatGPT, Gemini, Claude는 어떤 모델인가?

구분
ChatGPT
Gemini
Claude
개발사
OpenAI
Google DeepMind
Anthropic
목표
대중성과 실용성을 갖춘 대화형 AI
구글 서비스와 실시간으로 연동되는 업무용 AI
윤리 기준에 따라 스스로 판단하는 헌법형 AI
응답 스타일
대화 흐름이 자연스럽고, 사용자 친화적인 응답
텍스트/이미지 등 다양한 입력을 이해하고, gmail/docs 등과의 연동 작업을 지원하는 응답
윤리 기준을 기반으로, 신중하고 책임감 있게 판단한 응답
대표 요금제
(25년5월 기준)
Plus
$20/월
Advanced
29,000원/월
Pro
$17/월

모델뿐만 아니라 '버전'도 중요한 이유는 무엇인가?

ChatGPT, Gemini, Claude는 같은 모델이라도 GhatGPT 4o, Gemini 2.5 Flash, Claude Sonnet 4 등 버전에 따라 성능과 특성이 달라집니다.
예를 들어, 글쓰기에는 GPT-4.5와 Claude 4 Sonnet이, 수학/코딩 작업에는 ChatGPT o3와 Claude 4 Opus와 같은 모델이 더 적합합니다.
따라서 AI를 선택할 때는 모델뿐 아니라, 업무 목적에 최적화된 ‘버전’까지 고르는 것이 중요합니다.
이번 비교는 GPT-4.5, Gemini 2.5 Pro, Claude Sonnet 4를 기준으로 성능을 비교했습니다.

비교 및 평가 기준

1.
총 6가지 실무 상황을 선정
2.
동일한 조건에서 3가지 모델이 각각 어떻게 응답하는지 비교
3.
평가 기준 : 정확성 / 창의성 / 전달력 / 실용성
⇒ 실제 업무 환경에서 각 모델이 얼마나 실용적인 결과를 낼 수 있는지에 초점을 맞췄습니다.

Case 1 : 개념 설명

평가 기준 : AI가 개념을 얼마나 정확하게 설명하는지, 또 어떤 방식으로 정보를 구조화하는지 평가
프롬프트 : 클라우드는 무엇인가요? 7살 아이에게 클라우드 개념을 설명해주세요.
모델별 응답
가장 우수한 답변 : Gemini
정확성 : Gemini는 ‘마법 주머니’라는 비유를 사용해 클라우드 개념을 쉽고 명확하게 설명했습니다.
창의성 : Gemini는 다양한 비유를 활용해 개념을 독창적으로 설명했습니다.
전달력 : Gemini는 아이의 시선에 맞춘 표현으로 몰입감 있게 전달했습니다.
실용성 : Gemini는 유아용 콘텐츠로도 활용이 가능할 만큼 완성도가 높았습니다.

Case 2 : 요점 요약

평가 기준 : 정보를 얼마나 간결하게 압축하고, 구조화하느냐가 중요한 기준.
프롬프트: 해당기사*의 주요 내용을 요약하세요. 5문장 이내로 요약하세요.
모델별 응답
가장 우수한 답변: Gemini
정확성 : Gemini는 기사의 핵심 정보를 빠짐없이 담았습니다.
창의성 : Gemini는 항목별 정리로 글 구성에 차별성이 있었습니다.
전달력 : Gemini는 문장이 자연스럽고 가독성이 뛰어났습니다.
실용성 : Gemini는 실무에 바로 활용할 수 있을 만큼 완성도가 높았습니다.

Case 3 : 번역

평가 기준 : 번역은 문화적 맥락과 비유적 의미까지 정확히 이해하고 전달하는 작업이고, 속담은 시대적 가치관과 사고방식을 담고 있어 해석하는 능력이 필요합니다. 따라서 속담 번역을 요청하여 의미 전달의 정확성, 맥락 이해도, 표현의 자연스러움 등을 평가했습니다.
프롬프트 : 프랑스어 속담 ‘Il ne faut pas vendre la peau de l’ours avant de l’avoir tué.’를 번역해 주고, 그 의미를 설명하세요.
모델별 응답
가장 우수한 답변 : Claude
정확성 : Claude는 속담의 원문과 문화적 맥락, 교훈까지 충실히 전달했습니다.
창의성 : Claude는 예시, 언어 비교, 유래 설명 등을 활용해 내용이 풍부했습니다.
전달력 : Claude는 표와 단계별 설명을 통해 이해를 도왔습니다.
실용성 : Claude는 다양한 콘텐츠에 활용할 수 있을 만큼 완성도가 높았습니다.

Case 4 : 사업 아이디어 생성

평가 기준 : 구성력, 수익 구조, 창의성 측면에서 비교 평가
프롬프트 : 지속 가능한 소비를 유도하는 리워드 기반 쇼핑 앱을 기획하세요.
모델별 응답
가장 우수한 답변: Claude
정확성: Claude는 기능 제안은 물론, UI/UX 구성부터 런칭과 마케팅 전략까지 현실성 있게 제시했습니다.
창의성: Claude는 레벨업 시스템, 럭키박스, 지역 랭킹 등 차별화된 요소를 통해 ‘게임처럼 즐기는 친환경 플랫폼’이라는 신선한 아이디어를 제안했습니다.
전달력: Claude는 항목 구성과 표현이 자연스럽게 정리되어 있어, 분량 대비 가독성이 좋았습니다.
실용성: Claude와 Gemini는 바로 실무에 활용할 수 있을 만큼 완성도가 높았습니다.

Case 5 : 창의적 글쓰기

평가 기준: 단순한 정보 생성 능력을 넘어, 문학적 구성력과 메시지 전달력을 중심으로 모델을 비교
프롬프트 : ‘내일’을 예측할 수 있는 시계를 손에 넣은 사람에 대한 반전 소설을 작성해 주세요.
모델별 응답
가장 우수한 답변: Claude
정확성: Claude는 ‘내일을 예측하는 시계’라는 설정을 인간의 선택과 책임이라는 주제로 확장하며, 세계관과 사건 전개를 탄탄하게 구성했습니다.
창의성: Claude는 시계가 예측을 멈추는 전환과 결말의 반전을 통해 창의성을 보여줬습니다.
전달력: Claude는 장면 간 연결은 다소 부족했지만, 표현이 명확해 몰입도가 높았습니다.
실용성: Claude는 완성도가 높아 일부 다듬으면 활용이 가능한 수준이었습니다.

Case 6 : 블로그 게시물 작성

평가 기준: 주제 및 목적에 맞춰 콘텐츠를 얼마나 효과적으로 구성할 수 있는지를 평가하기 위한 항목. 정보 구성력과 블로그에 적합한 문체 및 완성도를 중심으로 비교
프롬프트: 생성형 AI가 교육 분야에 미치는 영향을 블로그 스타일로 설명하세요.
모델별 응답
가장 우수한 답변: Gemini
정확성 : Claude는 정보 구성이 가장 균형 잡혀 있었습니다. Gemini는 주제에 맞는 핵심 요소들을 고르게 담아냈고, ChatGPT는 전체적인 맥락은 잘 파악했지만 표현 및 내용이 다소 교과서적이었습니다.
창의성 : Gemini는 친근한 제목과 대화하듯 자연스러운 전개로, 블로그다운 글을 잘 보여줬습니다.
전달력 : Gemini는 문단 구성과 흐름이 자연스러워 독자의 몰입을 유도했습니다.
실용성 : Gemini는 별도 수정 없이 바로 콘텐츠로 활용할 수 있을 만큼 완성도가 높았습니다.

정리

Gemini는 논리적인 구조, 실용성 측면에서 강점
개념 설명, 기획서 작성에 적합
Claude는 감정선과 철학적 깊이가 있음
감성 콘텐츠, 창의적 글쓰기에 적합
ChatGPT는 간결하고 안정적인 문제
초안 작성, 대화형 콘텐츠 작업에 적합
Subscribe to 'Toolly'
Subscribe to my site to be the first to receive notifications and emails about the latest updates, including new posts.
Join Slashpage and subscribe to 'Toolly'!
Subscribe
👍