Yejun Cheon
log
study
read
coffee
Sign In
what I read & watch

노정석 팟캐스트 ep58

예
예준천
Mar 20, 20263m ago
카테고리
Empty

새로 알게 된 사람들.

Noam Brown
Dwarkesh
Ilya Sutskever

새로 배운 개념

harness : context engineering, RAG, DPO, 에이전틱 프레임워크, Rule-based tool calling 을 종합하는 표현. sclae 이 아닌 모든 것.
System1(직관) vs System2(추론) : 미적분을 처음 배울 때는 엄밀한 증명이 필요하지만, 익숙해지면 sys1의 단계로 들어와 적은 ttc 를 가지고도 풀수 있다.

인사이트

•
o1을 활용한 유즈케이스가 아직 부족하다.
•
스케일의 법칙은 여전히 유효하지만, 소프트 배리어는 존재할거다.
물리적으로는 가능하지만, 비용적 문제, 실리적 문제에 의해 자원을 덜 투입하는 경계가 존재한다.
•
지식의 복리효과 :
드와케시는 AI를 활용하여 더 많은 지식을 빠르고 정확하게 학습한다.
이 AI 시대에도 끊임없이 공부하는 역량은 필수적이다. 아무리 모델이 발전해도 모델은 사용자의 문제를 해결하고자 학습되어있음. 결국 요구자의 역량만큼 이끌어 낼 수 있음.
•
에이전틱 시스템과 harness는 결국 목발과 같아 6개월 후에는 scale에 의해 의미가 없어진다.
그러면 결국 우리의 역할은 좋은 문제를 찾고, 꾸준히 자원을 투입하는 것.
•
뜬금없는 지식의 연결
최단거리 알고리즘 : A와 B를 잇는 최적의 개념 C를 찾는다.

TTC와 에이전트

Scaling Test Time Compute to Multi-Agent Civilizations — Noam Brown
•
광범위한 적용 가능성: 추론 모델은 코딩이나 수학과 같이 "쉽게 검증 가능한" 영역뿐만 아니라, "성공이 덜 명확하게 정의된" 심층 연구(Deep Research)와 같은 영역에서도 뛰어난 성능을 보임을 강조합니다. 그는 Deep Research 모델이 "성공을 쉽게 검증할 수 있는 지표가 없는 영역에서 이 모델들이 엄청나게 잘하고 있다는 존재 증명"이라고 말합니다.
•
현실세계에서는 체스게임에서 illegal movement를 한 뒤, 아ㅎㅎ 장난이었어. 할 수 없다. 이미 유리컵은 깨져있을 것이기 때문. 그렇기에 test time compute을 통한 simulation이 좋다.
'Yejun Cheon' 구독하기
사이트를 구독하면 새 포스트 등 최신 업데이트를 알림과 메일로 가장 먼저 받아보실 수 있습니다.
Slashpage에 가입하고 'Yejun Cheon'을 구독하세요!
구독
👍