AI 정보 자료실

2025-12-1 조코딩 트렌드 뉴스

정

정미영

2025年12月4日7ヶ月前

카테고리

未設定

유튜브 영상 요약: AI 뉴스 (2y58QCE18Jw)

제공된 영상(2y58QCE18Jw)의 내용을 타임라인 및 이슈 중심으로 정리했습니다.

1. 이미지 생성 모델 경쟁 심화

•

Z-Image (알리바바, 오픈 소스):

◦

특징: 고작 6 빌리언 파라미터의 작은 모델로, 소비자용 GPU(16GB VRAM)에서도 구동 가능하며, 0.94초의 빠른 생성 속도를 자랑합니다.

◦

품질: 포토 리얼리스틱 퀄리티가 뛰어나며, 나노바나에 비견될 정도의 사실적인 피부 질감과 정교한 글씨 표현이 가능합니다.

◦

버전: 빠른 속도의 Z-Image Turbo가 공개되었으며, 더 좋은 성능의 Z-Image Base와 이미지 편집 특화 Z-Image Edit 모델도 곧 출시될 예정입니다.

•

Flux 2 (Black Forest Labs): 2:54"

◦

특징: 이미지 변형(나뭇잎 색상 변경, 카멜레온 나비 등), 인물 유지, 이미지 합치기 등의 기능이 정교합니다.

◦

오픈 소스: 32 빌리언 파라미터의 Dev 모델은 크기가 커서 Z-Image에 비해 주목도가 낮았으나, 더 작은 크기의 Flux 2 Calin (아파치 2.0 라이센스) 출시를 예고했습니다.

◦

성능: 벤치마크 점수에서 기존 나노바나 모델을 뛰어넘었습니다.

2. LLM 및 전문 모델 업데이트

•

클로드 오퍼스 4.5 (Anthropic, 코딩 최강): 4:24"

◦

성능: 코딩 벤치마크 (소프트웨어 벤치 베리파이드)에서 80.9점으로 SOTA(State-Of-The-Art) 1위를 달성했습니다. 이는 Gemini 3 Pro, GPT-5.1 코스 맥스보다도 높은 점수입니다.

◦

가격: 이전 Opus 4.1 모델 대비 가격을 1/3 수준으로 대폭 낮췄습니다. ($27 → $9)

◦

평가: 앤트로픽 내부 테스트에서 클로드 오퍼스 4.5는 역대 모든 인간 지원자보다 높은 점수를 받았습니다.

•

DeepSeekMath-V2 (DeepSeek, 수학):

◦

성능: 수학 올림피아드 금메달 수준의 성능을 달성한 오픈 소스 모델입니다. 다른 프론티어 모델들보다도 높은 점수를 기록했습니다.

•

BD2 (ByteDance/틱톡, 멀티모달):

◦

성능: 영상 이해 능력 벤치마크에서 Gemini 3 Pro보다도 높은 점수를 기록했습니다.

◦

활용: 틱톡의 '스마트 스플릿' 기능에 적용되어 영상 편집 자동화(장면 검색, 쇼츠 클립 변환 등)를 간소화할 예정입니다.

•

HunyuanOCR (Tencent, OCR):

◦

성능: 1 빌리언 파라미터만으로 SOTA 성능을 달성했으며, GPT-4.5나 Gemini 2.5 Pro보다 OCR을 더 잘합니다.

◦

기능: 복잡한 문서의 테이블 추출, 영수증 정리, 차트 분석, 수식 및 화학식 인식 등 광범위한 OCR 작업을 수행합니다.

3. 오픈AI의 사업 확장 및 새로운 디바이스

•

쇼핑 리서치 공개: 06:05"

◦

AI가 사용자 설문을 기반으로 쇼핑 아이템을 심층 분석하여 제품을 추천하고, 가격대별 비교 등을 정리해 주는 기능입니다.

•

ChatGPT 광고 도입 (예고):

◦

안드로이드 앱 베타 버전에서 광고 관련 API 정보(애드 타겟, 애드 타겟 타입 등)가 공개되었습니다.

◦

배경: HSBC 추정치에 따르면 오픈AI는 최소 2,070억 달러의 추가 자금 조달이 필요한 상황으로, 계속되는 적자 때문에 광고 도입은 불가피한 구조로 분석됩니다.

•

ChatGPT 기본 기능 통합: 07:36"

◦

기존에는 별도의 보이스 기능으로 작동했지만, 이제는 텍스트를 보여주며 대화하고, 화면을 보면서 지도, 이미지 검색 등 다양한 기능을 대화 중에 통합적으로 사용할 수 있습니다.

•

샘 알트먼 & 조니 아이브의 새로운 AI 디바이스:

◦

애플의 디자인을 담당했던 조니 아이브와 샘 알트먼이 AI 시대에 맞는 새로운 기기를 개발 중입니다.

◦

출시 계획: 2년 내 출시 목표이며, 시제품은 이미 완성되었습니다.

◦

특징: 현대 스마트폰 앱 환경의 복잡성과 소음 문제를 해결하기 위해 고안되었으며, 디스플레이 없이 마이크와 카메라로 사용자의 삶을 상황적으로 인식하는 주머니 크기의 기기인 것으로 전해집니다.

4. 구글 및 기타 주요 소식

•

Google TPU의 메타 대규모 공급 논의: 08:58"

◦

구글이 메타에 자체 개발한 TPU를 대규모로 공급하는 방안을 논의했습니다.

◦

영향: 엔비디아 매출의 10%에 달하는 것이 목표로 언급되면서 엔비디아 주가가 하락하고 구글 주가가 상승하는 등 AI 칩 시장의 경쟁 구도가 부각되었습니다.

•

구글 개발자 프로그램:

◦

연간 $299의 프리미엄 요금제에 가입하면 $550 상당의 생성형 AI 및 클라우드 연간 크레딧을 제공하여, API 이용자에게는 실질적인 혜택이 되는 프로그램입니다.

•

Photoshop on Chrome: 10:32"

◦

어도비 포토샵 기능이 크롬 익스텐션으로 출시되었으며, 12월 8일까지 가입 시 12개월 동안 무료로 이용 가능합니다.

◦

기능: 이미지 배경 제거, 자르기, 웹에서 이미지 검색 후 바로 포토샵으로 가져오기, **생성 채우기(Generative Fill)**와 같은 고급 편집 기능도 제공됩니다.

•

Fara-7B (마이크로소프트) 및 Strix:

◦

Fara-7B: 온디바이스용 에이전트형 소규모 언어 모델(7B)로, Qwen 2.5 VL-7B를 기반으로 하여 컴퓨터 사용(쇼핑, 탐색 등)을 자동화하는 데 높은 성능을 보입니다.

◦

Strix: 침투 테스트 및 모의 해킹을 자동으로 수행하는 오픈 소스 AI 에이전트입니다.

•

LTX Studio의 Retake 기능: 16:02" https://app.ltx.studio/

◦

영상 생성 AI 서비스에서 전체 영상을 다시 만들 필요 없이 원하는 부분만 선택하여 대화, 감정, 장면을 수정 및 재구성할 수 있는 기능입니다. (예: 특정 인물을 울게/웃게 하거나 대사 변경)

•

알리바바 AI 안경 '쿼크 S1': 19:26"

◦

메타 스마트 글래스와 유사한 AI 스마트 글래스를 출시했습니다. LM Qwen 모델이 탑재되었으며, 배터리 분리가 가능한 것이 특징입니다. (고급형 S1: 디스플레이 탑재, 보급형 G1: 디스플레이 없음)

5. AI 연구 방향 및 미래 전망

•

확장의 시대에서 연구의 시대로:

◦

오픈AI 수석 연구원이었던 일리아 수츠케버는 팟캐스트에서 현재 AI 시스템은 인간처럼 유연하게 사고하지 못하며, 단순히 컴퓨팅 파워와 데이터를 늘리는 '확장의 시대'가 끝나가고 **'연구 중심의 혁신'**이 필요하다고 주장했습니다.

◦

예상: 5년에서 20년 후에는 초지능이 달성될 것이며, 새로운 ML 패러다임이 필요하다고 언급했습니다.

◦

공감: 이는 LM이 AGI에 도달할 수 없다고 주장한 얀 르쿤 교수의 '월드 모델' 주장과 궤를 같이 합니다.

•

미국 백악관 '제네시스 미션':

◦

AI를 활용하여 미국 정부의 방대한 과학 데이터, 슈퍼컴퓨터, 연구 인프라를 통합 운영하여 과학 혁신 속도를 획기적으로 높이는 새로운 국가 프로젝트를 시작했습니다.

•

Grok 5 vs T1 LoL 대결 제안:

◦

일론 머스크는 그의 AI 모델 Grok 5가 2026년에 리그 오브 레전드(LoL) 세계 최고 인간 팀을 상대로 승리할 수 있는지 대결을 제안했습니다. (시력, 반응 속도 등 인간과 동일한 제약 조건을 적용). T1은 "We are ready"라고 응답했습니다.

•

AI 스타트업의 현실:

◦

AR 스타트업 200곳을 역공학한 결과, **73%**가 단순한 프롬프트 엔지니어링이나 외부 API를 감싼 래퍼에 불과한 것으로 드러났습니다. 이는 AI 시대에 1인 창업가의 진입 장벽이 낮아지고 있음을 시사합니다.

「인터크루」を購読

サイトを購読すると、新規投稿などの最新情報を通知やメールでいち早く受け取れます。
Slashpageに登録して「인터크루」を購読しましょう！

購読する