# 로컬 LLM으로 투자 브리프를 만들 수 있을까: gpt-5.4 vs gemma4 

[https://slashpage.com/timetobe-py7tx/ndvwx728796v9m3z6jpg](https://slashpage.com/timetobe-py7tx/ndvwx728796v9m3z6jpg)

헤르메스를 통해 "레오"라는 직원을 만들고 이 레오에게 텔레그램으로 몇 번 요청한 결과 

위와 같은 해외 뉴스 브리핑을 2시간에 한 번씩 받을 수 있게 되었다.

문제는 블로그 글 작성에도 Codex 사용 리밋을 소모한다는 것이다.

데이터 수집 자체는 코드로 구현할 수 있고 브리프 형식도 정해져 있다면 로컬 모델로도 어느 정도 대체할 수 있지 않을까?

바로 테스트를 진행해보기로 했다.

작년에 AI공부한다고 거금을 들여 데스크탑을 마련했다.

RTX5070에 램32기가의 사양이라면 어느정도 작은 모델을 돌려볼 수 있지 않을까?

바로 '레오'에게 물어봤다.

> _뉴스 브리프 만들 때 LLM 모델이 쓰였어? 확인해서 이를 로컬 모델로 대체할 수 있을지 알고 싶어_

레오는 대답뿐 아니라 내 컴퓨터에 Ollama와 gemma4 소형 모델이 있는 걸 확인하고 API 응답 테스트 후 샘플까지 생성해서 기존 결과물과 비교까지 한 번에 수행해줬다.

레오가 정리해준 테스트 결과이다.

_방금 로컬 모델이 만든 테스트 결과 성격_

- _가능 여부: 확인됨_

- _품질: 짧은 경계형 브리프는 충분_

- _한계: 현재 gpt-5.4보다_

    - _구조화 정확도_

    - _미묘한 확률 판단_

    - _신호 강도 구분_

    - _문장 압축도_

_에서 다소 약할 가능성이 높습니다_

그리고 프롬프팅 튜닝하고 추가 테스트를 해보겠냐고 물어보기까지 했다.

진짜 쓸 수록 엄청나다.

필요한 작업 몇 단계를 한 번에 수행해서 결과를 공유하는 것에서 나아가

다음 스텝을 본인이 제시해주기까지.

이제 진짜 "어떤 문제를 풀 것인가"를 정의하는 역할만 남은 걸까?

For the site tree, see the [root Markdown](https://slashpage.com/timetobe-py7tx.md).