[251215] GPT-5.2, Gemini Deep Research Agent + Interactions API, MCP 전면화, Starcloud 우주에서 AI 모델 학습/실행, Disney × OpenAI, Google Labs Disco
OpenAI, GPT-5.2 정식 공개 개요 OpenAI가 12월 11일 GPT-5.2를 정식 출시하며 '전문작업(스프레드시트/문서/코드/툴 호출)' 성능을 전면에 내세움 자체 개발한 GDPval 벤치마크(44개 직무, 1,320개 태스크)에서 전문가 대비 우위/동률 70.9%를 기록 핵심 내용 제품 라인업 및 가격 Instant(빠른 응답), Thinking(코딩/수학/계획), Pro(최고 정확도) 컨텍스트 윈도우: 400,000 토큰, 최대 출력 토큰 128,000개 지식 컷오프: 2025년 8월 31일 API 가격: GPT-5.2 Thinking — $1.75/백만 입력 토큰, $14/백만 출력 토큰 (GPT-5.1 대비 40% 인상) 성능 벤치마크 GDPval: 70.9% (GPT-5.1 Thinking 38.8%, Gemini 3 Pro 53.3%, Claude Opus 4.5 59.6%) SWE-Bench Pro(소프트웨어 엔지니어링): 55.6% (Gemini 3 Pro 43.3%, GPT-5.1 50.9%) GPQA Diamond(대학원 과학 추론): GPT-5.2 Pro 93.2% (Gemini 3 Deep Think 93.8%와 근소한 차이) AIME 2025(수학): 100% (도구 없이 달성, Gemini 3 Pro는 코드 실행 필요) ARC-AGI-1: GPT-5.2 Pro가 최초로 90% 돌파 (90.5%) 실무 적용 사례 투자은행 스프레드시트 모델링: 주니어 IB 애널리스트 업무(3-statement 모델, LBO 모델) 내부 평가에서 GPT-5.1 대비 9.3%p 상승 (59.1%→68.4%) Box 테스트: 복잡한 문서에서 정보 추출 속도 40% 향상, 생명과학/의료 분야 추론 정확도 40% 향상 환각 감소: GPT-5.1 대비 38% 감소 (사실 기반 질문 벤치마크 기준)
- 주상원주

