# 노정석 EP72 ai & interface

![EP 72. AI & 인터페이스](https://youtu.be/myNgSPXish4?si=rWogyM5FDxMoqtty)

### 코딩 AI를 기반으로한 AGI 사정권

devin 팀은 cluade 모델이 너무 발전해서 내부 구조를 바꿨다.

추론모델과 CLI Tool로 모델(모델 자체 & harness)은 자기증강이 일어나고 있다. 

RL VR. 뭐든지 보상신호만 줄 수 있다면 학습가능하다.

### TRM

Supervised Learning만으로도 할 수 있는게 남아있다.

단일 도메인 task라면 알고리즘의 진보로 풀수 있는게 남아있다.

작은 모델들의 네트워크로 캄브리아를 만들 수 있지 않을까?

### super app

모바일 시대에서 일어났던 gate way position 을 가지는 슈퍼앱 쏠림 현상이

AI 시대에도 동일하게 될거다.

그 baseline이 이번 chatgpt 의 AppSDK.

### 진화의 과정 상상하기

- MCP로 한두 기능 연결

- AppSDK로 이 위에서 모든 걸 연결

- OS와 연결되기. 

- 새로운 폼팩터의 하드웨어로 seamless하게 사운드와 비디오스트림을 받아 24시간 나와 컨텍스트가 동기화되는 상황. 인터랙션할 때는 모바일에 의존하는.

sam의 답변 : ai가 어디서나 따라다닐 것

grek의 답변 : 생성형 UI. 인터페이스가 형체를 바꾼다는 생각을 해야한다.

### 빅테크에서 AX 를 도와준다

구글에서도 델타 팀 만듦.

Foward Development Engineer 의 역할도 프런티어 모델들이 대체할 수 있는거 아닐까?

중장기적으로는 팔란티어의 해자도 없어질 수 있겠다.

### CUA(Computer Use Agent)

각종 에이전트들 쏟아지는 중.

멀티모달로 vision을 써서 브라우저를 이해하는 작업들도 많음.

computer use 가 멀티모달 토큰이 폭발하는 시초점이 될 것이다.

그런데 굳이 computer use를 비전으로 처리해야하는가? 사실 더 정형화된 데이터로 표현하기 쉽지 않은가? IOS/Web 구분지어 만들듯이 / forAgent 같은 걸(MCP) 만드는게 더 좋지 않을까? 

전환기에 필요한 기술일수도 있다고 생각한다.

### (나쁘게 말하면)워크플로우 에이전트

openai에서 발표한 agent kit. 반응은 n8n같은 워크플로우 자동화 노코딩 드래그앤 드랍 툴 아니냐는 비판. 그런데 이것만 하더라도 도움이 될 분야는 많음.

google 은 opal을 출시. 양쪽 다 배포까지 쉽게 해줌.

왜 이런게 계속 나올까? 전환기에 유입되는 사람을 늘리기 위한 받침대일수도 있다. 결국 과거에 그랬듯이 복잡도가 올라가면 없어져버릴 수도.

스크래치의 철학 : Low floor, Wide walls, High Ceilings

### 역사로 보는 프로그래밍의 미래.

[자료](https://erucipe.notion.site/AI-UI-UX-288d5c9e7e5980d49bc8d95d6008bb00)

윈도우가 처음 나왔을 때 DOS 지지자들은 메모리 낭비라고 비판했다.

---

### Dynamic land

Communal computation 와 public space.

책상 위에 프로젝터가 있고, 공용으로 데스크탑을 사용하는 그런 프로젝트.

교육 쪽으로 

### Policy Gradient

내용은 다음주에 계속...

어려운 개념에 대해서 공부하다보면 gpt가 알려준 말은 어려움.

나의 문체로 입문해야한다. 한문단씩.

그걸 다시 피드백을 받고.

세상에 좋은 지식은 너무나 많지만, 그걸 나의 걸로 소화시키는 건 어렵다.

For the site tree, see the [root Markdown](https://slashpage.com/yejun-cheon.md).
