언어모델의 블랙박스를 밝혀라 : LLM은 어떻게 동작하는가?

우리가 보는 것은 진짜인가, 아니면 우리 마음의 창조물인가?

얼마 전, 넷플릭스에서 본 『오징어 게임 시즌 3』의 강렬했던 결말 장면이 아직도 머릿속에 남아있습니다. 마지막 게임은 하늘 위에서 펼쳐지는 이른바 '고공 오징어 게임'. 이 게임은 정사각형, 정삼각형, 그리고 완전한 원형의 기둥 위에서 차례로 진행됩니다. 특히 마지막 단계의 둥근 기둥 장면에서 주인공은 자신을 지배했던 탐욕의 굴레에서 벗어나기 위해 스스로 희생을 선택합니다. 이전까지 원(동그라미)은 탐욕과 집착을 상징했지만, 주인공이 아이와 미래를 위해 이 원 위에서 죽음을 택하면서 그 의미를 완전히 뒤집어 놓았습니다. 이 장면은 우리가 보는 현실이 절대적이지 않으며, 환경이나 경험에 따라 그 의미가 언제든지 달라질 수 있음을 생생히 보여줍니다. 참고로 저는 오징어 게임 시즌 3를 무척 재미없게 보았습니다. 문화가 보는 방식을 바꾼다? 두 개의 흥미로운 착시 연구 이와 비슷한 이야기를 최근 접한 두 가지 시각 착시 연구에서도 찾을 수 있었습니다. 영국 런던정경대학(LSE)의 이반 크루핀(Ivan Kroupin) 연구팀은 '코퍼 착시(Coffer illusion)'라는 그림을 서구 사회 사람들과 나미비아 농촌 사람들에게 보여줬습니다. 흥미롭게도 서구권 참가자들은 대부분 사각형을 본 반면, 나미비아 농촌 참가자들은 주로 원형을 봤습니다. 연구팀은 이것을 '목수의 세계(carpentered world)' 가설로 설명합니다. 즉, 우리가 살아온 환경이 뇌가 세상을 보는 방식을 결정한다는 것입니다. 그러나 또 다른 연구는 이 가설을 흔듭니다. 도르사 아미르(Dorsa Amir)와 채즈 파이어스톤(Chaz Firestone)은 '뮐러-라이어 착시(Müller-Lyer illusion)'를 통해, 이 착시가 환경과 무관하게 인간뿐 아니라 동물이나 앞을 전혀 보지 못했던 아이들까지 경험한다는 사실을 밝혔습니다. 이 두 연구는 서로 충돌하는 듯 보이지만, 사실은 우리가 보는 세상이 객관적 실체라기보다는, 우리 뇌가 끊임없이 해석하고 창조하는 것이라는 중요한 메시지를 던져줍니다. 보는 것도, 말하는 것도 결국은 '뇌의 환각' 신경과학자 아니 세스(Anil Seth)는 "우리가 보는 현실은 뇌가 만들어낸 통제된 환각(controlled hallucination)"이라고 표현합니다. 즉, 우리의 뇌는 객관적 세상을 그대로 보여주는 것이 아니라, 경험과 환경, 문화를 기반으로 세상을 주관적으로 해석해 우리 앞에 펼쳐놓습니다. 흥미로운 점은 이런 현상이 시각뿐 아니라 언어에도 똑같이 적용된다는 사실입니다. 스탠퍼드 대학의 심리학자 레라 보로디츠키(Lera Boroditsky)의 연구를 예로 들어보죠. 그녀는 독일어와 스페인어 화자들에게 '열쇠(key)'와 '다리(bridge)'를 묘사해 달라는 실험을 했는데, 두 언어에서 이 단어들의 성별이 서로 반대였습니다. 독일어에서 열쇠는 남성명사, 다리는 여성명사 스페인어에서는 열쇠가 여성명사, 다리는 남성명사 놀랍게도 독일어 화자들은 열쇠를 "무거운, 강한"과 같은 남성적 특성으로, 다리는 "아름다운, 우아한"과 같은 여성적 특성으로 묘사했습니다. 반대로 스페인어 화자들은 정반대의 묘사를 했습니다. 이처럼 우리가 사용하는 언어도 결국 우리 뇌가 현실을 창조하고 해석하는 방식을 결정합니다. 우리가 '본다'고 믿는 것도, '말한다'고 믿는 것도, 결국은 뇌의 통제된 환각인 셈입니다. 『오징어 게임』, 시각 착시, 언어가 말하는 같은 이야기 『오징어 게임』의 마지막 원형 기둥 장면이 강렬했던 이유도, 언어가 우리의 현실 인식을 바꾸는 것도 결국 같은 이유에서입니다. 우리가 절대적이라고 믿었던 세상의 의미가 얼마든지 변할 수 있고, 우리가 가진 언어나 문화, 경험에 따라 세상이 완전히 달라질 수 있다는 것입니다. 착시 현상과 언어 연구, 그리고 드라마가 우리에게 공통적으로 주는 메시지는 분명합니다. 세상은 우리의 마음속에서 언제나 재해석되고, 재창조된다. 그렇다면 우리가 삶을 더 긍정적으로 바꾸고 싶다면, 먼저 세상을 바라보는 우리의 방식부터 바꿔볼 필요가 있지 않을까요? 『오징어 게임』의 주인공이 원형의 의미를 탐욕에서 희생으로 바꿔놓았듯이, 우리도 삶에서 보는 것과 말하는 것의 의미를 새롭게 바꿀 수 있습니다. 우리가 경험하는 어려움, 고통, 심지어 행복까지도 결국은 우리가 그것을 어떻게 바라보느냐에 따라 달라질 수 있습니다. 사실 『오징어 게임』이라는 작품이 주목 받은 것 자체가 우리가 일상적인 세상 혹은 어릴 때 좋은 추억으로 남아 있던 게임들이 탐욕에 물든 어른들이 목숨을 걸고 하는 게임이 되어 버려서 였던 것 처럼. 약간의 시선을 바꾸면 완전 새로운 것 혹은 재밌는 것들이 나올 수 있지 않을까요?

Haebom

2025/07/07 10:00 AM

스테이블코인은 어떻게 디지털 금본위제가 되었나?

사람들은 종종 스테이블코인을 "디지털 금본위제"라고 부릅니다. 겉보기에는 부정확해 보이지만, 이 표현의 본질을 이해하면 상황이 달라집니다. 과거 금본위제는 금이라는 자산이 달러 발행의 한계를 설정했던 시스템입니다. 오늘날 스테이블코인은 민간 기업들이 달러를 담보로 디지털 자산을 발행하며 사실상 유사한 제한적 통화 발행 구조를 형성하고 있습니다. 그런데 왜 미국 정부는 지금 이 구조에 칼을 들이대려 하는 걸까요? 그림자 달러, 민간 주도의 달러 발행 시스템 스테이블코인의 가장 큰 문제는 미국 연준과 재무부가 달러의 유통과 공급량을 통제할 수 없게 만든다는 점입니다. USDT, USDC 등 스테이블코인은 미국 금융 당국의 손길이 미치지 않는 영역에서 전 세계로 빠르게 퍼져 나가고 있으며, 그 규모가 이미 무시할 수 없는 수준에 도달했습니다. 실제로 2024년 스테이블코인의 연간 거래량은 비자와 마스터카드 합산 거래량을 넘어서며 글로벌 결제 시스템의 핵심으로 자리 잡았습니다. 이는 미국이 전통적으로 독점해왔던 달러의 공급과 유통을 민간 기업과 분산 시스템이 대신하고 있음을 의미합니다. 이 현상은 미국 금융당국에게 근본적인 위협으로 다가왔습니다. 미국은 결코 민간 기업이 통화 발행의 권력을 나눠 갖도록 허락하지 않을 것이기 때문입니다. 음모론에서 정책 시나리오로: GENIUS Act의 숨은 목적 사실 GENIUS Act의 표면적인 목적은 "스테이블코인 시장의 안정성과 투명성 확보"입니다. 그러나 이 법안의 실제 조항을 깊이 들여다보면 숨은 의도가 드러납니다: 엄격한 발행자 제한: 정부가 승인한 기관 외 발행 금지 긴급 개입 권한: 자금 동결 및 발행 중단 권한 확보 해외 발행 스테이블코인 제재: 기술적 동결·소각 권한 명시 이를 통해 미국은 민간의 통화 발행 권한을 사실상 회수하고, 달러의 공급과 유통을 다시금 중앙집중적으로 통제하려 합니다. 이는 마치 1971년 닉슨 대통령이 금태환제를 중단하며 미국 정부가 달러 공급의 한계를 제거하고, 통화 공급을 완전 통제할 수 있게 되었던 것과 비슷한 효과를 노리는 전략적 행위입니다. 달러 패권 유지의 숨은 카드, 디지털 닉슨 쇼크? 더욱 우려되는 시나리오는 GENIUS Act가 단순히 스테이블코인을 규제하는 데 그치지 않고, 필요에 따라 스테이블코인을 전면 중지하거나 소각하여 디지털 세계의 달러 유동성을 일거에 흡수해 버리는 "디지털 닉슨 쇼크"의 도구로 사용될 가능성입니다. 기술적으로도 이는 충분히 가능합니다. 주요 스테이블코인은 중앙화된 발행 시스템을 통해 이미 발행된 코인을 동결하거나 소각할 수 있는 기능을 갖추고 있습니다. 만약 이런 일이 발생한다면, 암호화폐 시장 전체의 급격한 위축과 함께 글로벌 금융 질서가 크게 흔들릴 것입니다. 하지만 미국 입장에서는 오히려 이 혼란을 통해 글로벌 달러 유동성을 효과적으로 관리하고, 장기적으로 금융 패권을 유지할 수 있습니다. 결론: 통화 주권의 새로운 전쟁터, 디지털 스테이블코인 GENIUS Act는 결코 단순한 금융 안정화 법안이 아닙니다. 오히려 미국이 글로벌 달러 유통을 다시금 중앙 집중화하고, 새로운 금융 질서에 민간이 끼어드는 것을 막기 위한 철저히 전략적이고 정치적인 선택입니다. 2018년 한 암호화폐 관계자가 "미국이 스테이블코인을 통해 달러 유동성을 통제하려 한다"고 말했던 당시, 많은 사람들은 이를 그저 음모론으로 치부했습니다. 그러나 오늘날 현실은 이 음모론을 완벽히 정책화한 법안이 상원을 통과하는 지경까지 이르렀습니다. 이제 이 문제는 더 이상 음모론의 영역이 아닙니다. "미국 정부가 언제, 어떤 방식으로 스테이블코인 시스템을 통제하고 제거할 것인가?" 하는 현실적인 질문으로 바뀌었습니다. 역사가 반복되는 것일까요, 아니면 디지털 시대의 새로운 통화 전쟁이 시작된 것일까요? 이제 우리는 이 질문을 진지하게 마주해야 할 때입니다.

Haebom

2025/07/06 10:00 AM

중국의 슈퍼 앱(Super App)은 왜 성공했을까?

최근, 꼬치코칭을 통해 중국어에 능숙한 분을 만나봤습니다. 그러다 중국에서 자주 사용되는 앱들에 대해 이야기 하며 제가 사용해본 적이 있는 것들을 이야기 했습니다. 중국을 잘 모르시는 분들이라도 위챗(WeChat)은 한 번 들어 보셨을 겁니다. 중국에서는 위챗 없이는 거의 아무것도 할 수 없다는 농담도 있습니다. 식사 주문, 택시 호출, 쇼핑, 결제는 물론이고 심지어 정부 서비스까지 위챗 안에서 해결이 가능하죠. 한국에서 흔히 사용하는 카카오톡이나 네이버와 비교해도 훨씬 더 다양한 기능을 한 앱 안에서 제공합니다. 중국의 이런 ‘슈퍼 앱’ 현상은 단순히 중국인들이 더 편리한 것을 좋아해서일까요? 아니면 다른 이유가 있는 걸까요? 흔히들 동서양의 앱 디자인 차이를 설명할 때, "아시아인은 정보가 많고 복잡한 앱을 좋아하고, 서양인은 심플한 앱을 선호한다"고 말하곤 합니다. 하지만 실제로는 그렇지 않습니다. 최근 중국과 한국, 일본 등 아시아 국가의 앱들 역시 점차 더 깔끔하고 단순한 디자인으로 변화하고 있습니다. 그럼에도 불구하고, 왜 슈퍼 앱이 중국에서만 유독 강하게 자리 잡게 되었을까요? 스마트폰으로 시작된 ‘모바일 우선’ 시대의 출발점 2010년대 초반의 중국은 인터넷이 아직 제대로 정착되지 않은 상태였습니다. 당시 중국의 인터넷 보급률은 35% 미만이었고, 데스크탑 컴퓨터를 쓰는 사람들도 많지 않았습니다. 이런 상황에서 중국 소비자들에게 스마트폰이 최초의 개인용 컴퓨팅 기기가 된 것입니다. 이렇게 모바일 중심의 인터넷 환경이 처음부터 구축되면서 기존의 인터넷 습관들이 형성되지 않았습니다. 예컨대, 미국과 유럽의 경우 이미 웹 브라우저나 이메일 등 데스크탑 기반 인터넷 사용 습관이 자리 잡고 있었지만, 중국은 처음부터 모바일 앱이 주류였죠. 이 빈틈을 메운 것이 바로 텐센트(Tencent)의 위챗입니다. 위챗은 메신저로 시작했지만, '공식 계정(Official Accounts)'과 '미니 프로그램(Mini Programs)'을 통해 거의 모든 인터넷 서비스를 제공하기 시작했습니다. 사실상 위챗은 중국의 구글 크롬(Chrome)과 같은 브라우저 역할을 했던 셈이죠. 기존 웹 기반 서비스를 모바일로 옮기지 않고 처음부터 앱 중심의 환경을 만든 것입니다. 여기서 저는 늘 말하는 텐센트 마화텅 회장의 말을 떠올립니다. 마화텅은 텐센트의 QQ와 게임들이 카피캣이라고 놀림 받을때 이런 말을 했습니다. "우리는 고양이를 보고 호랑이를 그렸다" 초기 중국의 디지털 경제는 인프라가 매우 부족했습니다. 은행들은 소비자 친화적인 온라인 결제 시스템을 제공하지 않았고, 쇼핑은 현금 거래 위주였으며, 전자상거래는 신뢰를 얻지 못한 초기 단계였습니다. 이 상황에서 알리바바(Alibaba)는 타오바오(Taobao)의 온라인 거래를 위해 알리페이(Alipay)를 개발하여 자체 결제 시스템을 구축했습니다. 기업들은 필요한 서비스가 없으면 직접 만들어 내야 했습니다. 이것이 슈퍼 앱이 탄생한 진짜 이유입니다. 즉, 이상적인 사용자 경험(UX)을 위해서가 아니라, 시장의 공백을 메우고 산업 전반을 빠르게 점유하기 위한 필연적 선택이었습니다. ‘담장 쌓기’ 경쟁 전략의 등장 중국의 슈퍼 앱 성장은 또 다른 이유로 설명할 수 있습니다. 바로 극단적인 경쟁 환경 때문입니다. 텐센트, 알리바바, 바이두(Baidu), 바이트댄스(ByteDance) 같은 거대 기업들은 오랫동안 서로의 플랫폼 링크를 차단하는 이른바 '담장 쌓기(Walled Garden)' 전략을 사용했습니다. 위챗에서 타오바오의 쇼핑 링크를 열려고 하면 접속이 되지 않는 식이었죠. 따라서 각 기업은 자체 앱에 가능한 한 많은 서비스를 담으려고 했습니다. 이로 인해 위챗 같은 슈퍼 앱은 음식 배달, 택시 호출, 결제, 쇼핑, 소셜 미디어까지 모두 하나의 앱 안에서 제공하게 되었습니다. 중국 정부가 2021년에야 이런 링크 차단을 금지했지만, 이미 소비자 습관은 굳어졌고 슈퍼 앱 모델이 뿌리 깊게 자리 잡게 되었습니다. 또 다른 이유는 경제적 관점에서 찾을 수 있습니다. 초창기 중국 소비자들의 온라인 소비력은 서구에 비해 낮았기 때문에, 개별 앱 하나당 얻을 수 있는 고객의 생애 가치(Lifetime Value)는 적었습니다. 이에 따라 기업들은 한 고객에게 가능한 한 많은 서비스를 제공함으로써 고객당 수익을 극대화하려 했습니다. 또한 초기 고객 확보 비용이 매우 높았기 때문에, 앱 하나에 사용자를 모으면 그 사용자를 경쟁사로 보내지 않기 위해 더욱 많은 서비스를 통합했습니다. 텐센트가 위챗페이(WeChat Pay)를 홍보하기 위해 중국의 설날 춘절(CNY)에 ‘빨간 봉투(홍바오)’ 캠페인을 벌여 현금을 나눠준 것도 이와 같은 전략의 일환이었습니다. 문화적 선호가 아니라 전략적 선택 슈퍼 앱이 중국에서 성공한 이유는 사용자의 요구 때문이 아니라, 모바일 우선 환경, 산업 인프라의 부족, 치열한 경쟁 환경, 낮은 소비력과 같은 독특한 시장 조건들이 결합되었기 때문입니다. 그렇다면 다른 나라의 기업들이 슈퍼 앱 모델을 그대로 따라 해야 할까요? 꼭 그렇지는 않습니다. 오히려 중요한 교훈은 제품 설계의 결정이 무엇에 의해 이뤄지고 있는지를 이해하는 것입니다. 슈퍼 앱이 늘 정답은 아닙니다. 어떤 경우는 한 앱에 다양한 서비스를 묶는 게 좋을 수 있지만, 다른 경우는 최고의 사용자 경험을 제공하는 단일 앱을 만드는 게 더 효과적일 수 있습니다. 실제로 위챗은 모든 것을 다 해결할 수 있는 ‘완벽한 슈퍼 앱’은 아닙니다. 미니 프로그램으로 간단한 서비스를 경험하게 해주는 방식은, 사실상 모바일 환경의 '오픈 웹(Open Web)'과 같습니다. 사용자는 서비스를 미리 경험해 본 후, 필요하면 별도 앱을 다운로드합니다. 우리나라에서도 한 때 슈퍼앱이 미래라면서 호들갑을 떨었던 이들이 있었습니다. 하지만 그것을 실제로 해낸 곳은 누가 있나요? 개인적으로 진정한 슈퍼앱을 이뤄낸 것은 토스 정도 입니다. 이번에 토스가 추진하는 앱인토스가 이런 것의 본격적인 시작이라고 봅니다. 중국의 슈퍼 앱 사례를 통해 우리가 얻을 수 있는 가장 큰 시사점은, 비즈니스 필요성이 제품을 어떻게 진화시켰는지 이해하는 것입니다. 결국 제품의 성장은 사용자의 요구가 아니라, 기업들이 직면한 환경과 시장 조건의 전략적 대응에서 시작되니까요. 개인적으로 중국의 디지털 생태계나 기술력을 가장 과소 평가 하는 곳이 한국이라 생각합니다. 제가 늘 말하듯 중국 선진시 아니면 상하이 등만 가보셔도 내가 알던 중국이 아니구나 하는 생각이 들거에요.

Haebom

2025/07/05 8:27 PM

블랙박스를 넘어서: 금융권 AI의 설명 가능성을 실질적으로 구현하는 법

최근 금융 관련 서비스를 만드는 곳에 인공지능 기획, 아키텍쳐 자문을 하면서 금융업에서도 이런 논의가 가속화 되고 있다는 것을 느꼈습니다. ChatGPT 같은 생성형 AI가 큰 주목을 받고 있지만, 그보다 훨씬 이전부터 금융권에서는 인공지능(AI)을 적극 활용해왔습니다. 사기 탐지부터 신용 위험 관리, 심지어 초단타 거래 전략까지, 금융의 핵심 업무 곳곳에서 AI가 중요한 역할을 하고 있죠. 하지만 인공지능이 실제로 신뢰받고 윤리적으로 사용되기 위해서는 여전히 많은 숙제가 남아 있습니다. 그 중 가장 중요한 이슈가 바로 설명 가능성(Explicability)입니다. 금융권에서 AI 모델이 복잡할수록, 그것이 어떻게 의사결정을 내리는지 파악하는 일은 어려워집니다. 흔히 말하는 ‘블랙박스’ 문제죠. AI 모델이 정확한 예측을 내놓는다고 하더라도, 그 예측이 어떤 기준과 과정에 따라 이루어졌는지 설명할 수 없다면, 특히 금융처럼 신뢰가 필수적인 영역에서는 심각한 문제가 될 수 있습니다. 그래서 오늘은 이 ‘설명 가능성’이란 무엇이고, 금융권에서 실제로 어떻게 구현할 수 있는지에 대해 깊이 있게 살펴보고자 합니다. 잠시 흥미로운 예시를 하나 들어볼까요? 2019년, 애플 카드(Apple Card)는 성차별적 대출 심사 논란으로 사회적 이슈가 되었습니다. 같은 소득과 신용도를 가진 부부가 신청했는데, 남편의 신용 한도가 아내보다 월등히 높게 책정된 것이죠. 사람들은 즉각 이 결정이 ‘성별에 따른 차별’이라고 비판했습니다. 그러나 정작 카드 발급사와 심사 알고리즘을 관리하던 금융기관들은 이 문제가 발생한 이유를 정확히 설명하지 못했습니다. 결과적으로 심각한 이미지 타격을 입었죠. 이 사례는 금융권에서 AI가 작동할 때 발생할 수 있는 문제를 잘 보여줍니다. AI는 데이터 기반으로 의사결정을 내리는데, 데이터 자체가 편향되어 있거나, 알고리즘의 판단 기준이 명확히 드러나지 않는다면 금융기관은 심각한 윤리적·법적 책임을 질 수 있습니다. 이런 맥락에서 금융권에서는 AI를 사용할 때 반드시 다음과 같은 질문을 해야 합니다. “우리의 AI 모델은 왜 그런 결정을 내렸는가?” “AI가 내린 결정은 과연 공정한가?” “AI 모델의 판단 기준을 우리가 설명할 수 있는가?” AI 설명 가능성을 이루는 세 가지 핵심 요소 설명 가능성(Explicability)은 단지 모델의 작동 방식을 기술적으로 보여주는 것 이상입니다. 금융권에서 AI의 설명 가능성을 제대로 구현하기 위해서는 다음 세 가지 요소를 모두 갖춰야 합니다. (1) 투명성(Transparency) AI 모델이 어떻게 구성되어 있는지, 어떤 데이터로 훈련되었는지, 어떤 전제 조건이나 가정을 바탕으로 작동하는지를 이해관계자에게 명확하게 공개하는 것입니다. 예를 들어, 신용 평가 모델의 데이터 출처와 평가 변수 선정 이유를 고객과 규제 당국에 공개함으로써 신뢰를 얻을 수 있죠. (2) 해석 가능성(Interpretability) AI의 결정을 인간이 쉽게 이해할 수 있도록 하는 것입니다. 모델의 작동 방식을 단순한 알고리즘이나 시각적 도구를 통해 설명할 수 있어야 합니다. 예를 들어, 대출 신청을 거부한 이유를 구체적인 데이터 포인트로 설명할 수 있어야 합니다. (“당신의 신용카드 사용률이 높아 대출이 거절되었습니다.” 등) (3) 책임성(Accountability) AI 모델이 내린 결정에 대해 명확한 책임 소재를 정하고, 문제가 발생했을 때 어떻게 대응할지 사전에 정하는 것입니다. 모델이 잘못된 결정을 내렸을 때, 이를 즉각 수정하고 피해를 구제할 수 있는 명확한 프로세스와 책임자를 설정하는 것이죠. 이 세 가지 요소를 모두 아우르는 통합적 접근이 금융권에서 AI의 설명 가능성을 제대로 구현하는 핵심이라고 할 수 있습니다.

Haebom

2025/07/02 8:53 PM

AI가 의사보다 네 배 더 정확하다고?

병원을 찾을 때 우리는 늘 정확한 진단과 빠른 치료를 기대합니다. 하지만 현실은 긴 대기 시간과 의사 인력 부족으로 인해 원하는 때에 치료받기 쉽지 않죠. 그런데 최근 마이크로소프트(Microsoft)가 공개한 놀라운 연구가 의료계에 새로운 가능성을 제시했습니다. 바로 인공지능(AI)을 활용한 진단 시스템이 인간 의사보다 네 배나 정확한 진단을 내렸다는 것입니다. "AI가 정말 의사를 대체할 수 있을까?" 하는 의문이 드는 것도 사실 입니다. AI 진단 오케스트레이터, 의료계에 등장하다 마이크로소프트가 발표한 "AI 진단 오케스트레이터(Microsoft AI Diagnostic Orchestrator, MAI-DxO)"는 단순한 인공지능 모델이 아닙니다. 이 시스템은 서로 다른 역할을 맡은 다섯 명의 의사가 모인 패널처럼 설계됐습니다. 각 AI 에이전트가 가설을 세우고, 검사 항목을 선택하고, 최종 진단을 내리기 위해 서로 의견을 주고받으며 가장 적절한 치료 방법을 도출하는 방식이죠. 여기서 흥미로운 점은 AI가 결론에 도달하는 과정을 명확히 보여준다는 것입니다. 마이크로소프트는 이를 '체인 오브 디베이트(Chain of Debate)'라 부르며, AI가 어떤 논리를 통해 문제를 해결했는지를 투명하게 공개했습니다. 인간 의사를 뛰어넘는 정확성? 그렇다면 이 AI는 실제 의료 현장에서 얼마나 효과적일까요? 이를 검증하기 위해 마이크로소프트는 미국 최고 의학 저널인 NEJM(New England Journal of Medicine)에 실린 가장 까다로운 진단 사례 304건을 AI에게 제시했습니다. 결과는 놀라웠습니다. AI가 가장 잘 작동한 경우(OpenAI의 o3 모델 사용)의 진단 정확도는 무려 85.5%였습니다. 같은 사례를 진단한 숙련된 인간 의사들의 성공률은 단 20%였습니다. 인간 의사들이 교과서나 동료의 도움을 받을 수 없었다는 한계가 있었지만, 그럼에도 AI의 압도적인 성과는 의료계의 큰 충격으로 다가왔습니다. 비용과 시간까지 절약하는 AI 정확성뿐만 아니라 비용 절감 효과도 눈길을 끌었습니다. 마이크로소프트는 AI에게 진단 과정에서 비용을 고려하도록 설정했고, 이에 따라 필요한 검사 수가 크게 줄어들어 실제 사례에서 수십만 달러의 비용을 절약할 수 있었다고 합니다. "이 시스템은 우리가 본 것 중 가장 뛰어난 AI 성능을 보였으며, 의료 접근성의 새로운 문을 열 수 있다." 마이크로소프트의 도미닉 킹(Dominic King) 박사는 이렇게 평가했습니다. AI 모델은 이제 '상품', 진짜 경쟁력은 '조합력' 이 실험에서 마이크로소프트는 OpenAI뿐 아니라 메타(Meta), 앤트로픽(Anthropic), 구글(Google), xAI 등 여러 기업의 AI 모델을 활용했습니다. 특히 최고 성능을 보인 OpenAI의 모델도 궁극적으로는 '상품화(commodity)'될 것이며, 진정한 차별성은 이런 모델들을 통합하고 조합하는 '오케스트레이터'에 있다고 무스타파 술레이만(Mustafa Suleyman)은 강조했습니다. 마이크로소프트는 이 기술을 자사의 AI 챗봇 코파일럿(Copilot)과 빙(Bing) 검색엔진에도 적용할 계획이라고 밝혔습니다. 이는 하루 5천만 건이 넘는 건강 관련 질문을 처리하는 플랫폼에서 엄청난 잠재력을 발휘할 것으로 기대됩니다. '의료 초지능' 시대, 준비가 필요하다 무스타파 술레이만은 이번 연구를 '의료 초지능(Medical Superintelligence)'을 향한 첫걸음이라 표현합니다. 더 빠르고 정확하며 저렴한 진단이 가능한 미래가 코앞으로 다가온 것입니다. 하지만 아직 임상 환경에 도입하기에는 추가 검증이 필요합니다. 심장 전문의이자 AI 의료 권위자인 에릭 토폴(Eric Topol) 박사 역시 이 연구가 실제 의료 환경에서 이루어진 것은 아니지만, AI가 가진 의료 효율성의 가능성을 입증한 중요한 연구라고 평가했습니다.

Haebom

2025/07/02 8:43 PM

Z세대의 성적 불황을 이해하기

"요즘 젊은 사람들은 너무 섹스를 안 해요. 믿기 어려울 정도죠." 2016년, 미국의 매체 '버슬(Bustle)'은 20대 초반 젊은이들 사이에서 성관계 빈도가 급감했다는 충격적인 연구 결과를 소개하며 이렇게 선언했습니다. 이후, 이 현상은 '섹스 불황(Sex Recession)'이라는 이름으로 불리며 큰 화제를 모았습니다. 미국 '애틀랜틱'의 표지에 등장한 벌과 새가 서로 등을 돌리고 있는 그림은 이 세대의 성적 단절을 강렬하게 표현했죠. 과거의 어른들이 걱정한 것은 '너무 난잡한 젊은이들'이었지만, 오늘날의 기성세대는 오히려 '섹스를 기피하는 젊은이들'을 우려합니다. 실제로 최근 통계에 따르면 Z세대(1990년대 중반~2010년대 초반 출생)의 성관계 빈도가 전례 없이 낮아지고 있습니다. 2018년 한 조사에 의하면, 18~24세 남성 중 약 3분의 1과 여성의 5분의 1이 일 년 이상 성관계를 하지 않은 것으로 나타났고, 팬데믹은 이 현상을 더욱 심화시켰습니다. 2021년에는 캘리포니아의 1830세 중 거의 40%가 성관계 경험이 없었다고 답했죠. 모든 것이 가능하지만, 아무것도 원치 않는 세대 흥미롭게도, Z세대는 이전 세대보다 성에 대해 더욱 개방적이고 다양한 선택지를 가진 세대입니다. 스마트폰 하나면 쉽게 데이팅 앱을 통해 짧고 가벼운 만남을 가질 수 있고, 다양한 성적 취향이 자유롭게 수용되는 시대를 살아갑니다. 그런데 왜 이들은 성을 멀리할까요? 이에 대해 영국 저널리스트 루이스 페리(Louise Perry)는 다소 보수적이지만 흥미로운 관점을 제시합니다. 그녀의 책 『21세기 성 가이드(A New Guide to Sex in the 21st Century)』에서는 성을 진지하게 받아들이고, 남녀 간의 생물학적 차이를 인정하며, 캐주얼한 성관계의 위험을 경고합니다. 페리는 "모든 남성은 맨손으로 거의 모든 여성을 죽일 수 있다"는 강렬한 경고와 함께, 여성들이 섹스 파트너를 신중히 선택해야 한다고 주장합니다. 반면, 가디언(Guardian)의 기자 카터 셔먼(Carter Sherman)은 자신의 책 『두 번째 혁명(The Second Coming)』에서 Z세대가 성적 불황을 겪는 이유를 정치적 보수주의와 인터넷이라는 거대한 힘 사이에 끼인 결과로 설명합니다. 온라인은 무한한 성적 콘텐츠를 제공하는 동시에 성적 상품화를 부추기고, 이는 실제적인 친밀감을 저해하는 결과를 가져왔다는 것이죠. Z세대는 어린 나이부터 포르노에 과도하게 노출되어 오히려 성에 대한 건전한 태도를 형성하기 어려워졌습니다. 성적 불황의 진짜 이유는 '관계'의 불황이다 성적 불황의 근본적인 문제는 바로 '외로움'입니다. Z세대는 이전 세대보다 훨씬 더 불안과 우울을 겪고 있으며, 타인과의 친밀한 관계 형성에도 어려움을 느끼고 있습니다. 또한 술 소비가 줄어든 것도 주목할 만합니다. 술은 이전 세대에게 있어 타인과 빠르게 친밀감을 형성하는 매개체였지만, Z세대는 이마저도 멀리하며 더욱 관계 맺기에 어려움을 겪고 있습니다. 소셜 미디어의 영향으로 자신의 매력을 수치화된 기준으로 끊임없이 평가받는 환경 또한 친밀감 형성에 장애물이 됩니다. 결국, 성적 불황은 관계 맺기의 어려움과 타인과의 진정한 연결이 희박해진 사회적 현상을 반영하는 것입니다. 우리는 무엇을 해야 할까? 루이스 페리와 카터 셔먼 모두 각자의 관점에서 성적 불황의 원인을 짚고 있지만, 결국 두 저자 모두가 간과한 것은 바로 성이 지닌 '즐거움과 연결의 힘'입니다. 성은 단순히 육체적 쾌락만을 제공하는 것이 아니라 인간이 타인과 가장 깊이 있고 직접적으로 연결될 수 있는 소중한 영역입니다. 친밀한 관계 속에서 우리는 서로를 이해하고, 존중하며, 사랑하는 법을 배우게 됩니다. 우리 사회는 Z세대가 다시 성을 통해 건강한 인간관계와 즐거운 경험을 만들어갈 수 있도록 돕기 위한 논의가 필요합니다. 성적 불황의 근본 원인을 단지 개인의 문제로 축소시키지 말고, 보다 포괄적이고 심층적인 사회적 대화를 시작할 때입니다. 최근 이런 기사를 보며 실제로 Z세대들이 원하는 것은 '단순한 만남'이 아닌 상대를 이해하고 알아가는 과정 같은데 그것이 자만추라고 부르는 영역인지... 아니면 예전에 유행했던 Resume 소개팅 같은 것인지는 잘 모르겠습니다. 섹스 불황(Sex Recession)이라는 표현이 재밌어서 좀 찾아보았네요.

Haebom

2025/07/02 8:37 PM

바이브 코딩 삽질기 EP.02 (feat. 수익화)

최근 제가 올린 바이브 코딩 관련 글이 생각보다 많은 관심을 받았습니다. 특히 구체적인 수익 이야기를 솔직히 공유했더니 많은 분들이 공감하고 흥미롭게 봐주셨죠. 덕분에 기분 좋게 지내고 있었는데, 얼마 전 뜻밖의 상황을 마주했습니다. 바로 익명의 누군가가 제가 운영하는 해외 법인 관련해서 신고를 했던 일입니다. 처음엔 정말 놀랐어요. 제가 위법한 일을 한 것도 아닌데, 뜬금없이 신고가 들어오니까 황당하더라고요. 이번 경험을 통해 저처럼 해외 법인이나 글로벌 결제를 고민하는 분들에게 유용할 법한 이야기를 나눠보려 합니다. 🚨 무슨 신고였을까요? 신고의 내용은 이렇습니다. 제가 Stripe Atlas로 설립한 해외 법인에 대해, 국내에서 필요한 각종 신고나 절차를 제대로 이행하고 있는지에 대한 민원이었습니다. 결론부터 말씀드리자면, 저는 다행히 아무 문제 없었습니다. 왜냐면 저는 처음부터 전문 세무사님을 통해 세금 신고(종합소득세)와 외국환거래 신고 등을 확실하게 처리하고 있었거든요. 마침 종소세 시즌이기도 해서 세무사님과 서류 준비를 꼼꼼히 하고 있던 중이었습니다. 이촌세무회계법인 늘 감사합니다. 한국에서 해외법인을 운영할 때 꼭 알아야 하는 것 그런데 이번 일을 겪으며 알게 된 사실이 있습니다. 의도치 않게 저의 경우 이미 준비가 돼 있었지만, 만약 미리 제대로 준비를 하지 않았다면 복잡하고 귀찮은 상황이 생길 수 있다는 거예요. 한국에서 해외법인을 설립하거나 운영할 때 반드시 해야 하는 의무들이 있습니다. 자세한 것은 사실 저도 잘 모르기에 세무사님의 조언과 지시를 따랐습니다. 외국환거래 신고 (외국환은행을 통해 해외직접투자 신고 및 정기 보고 필수) 종합소득세 신고 (국내에서 발생한 소득 외에 해외에서 발생한 소득도 포함해서 처리) 위 절차는 어렵지는 않지만, 미리 안 해놓거나 깜빡하면 불필요하게 복잡해질 수 있습니다. 개인적으로 도움 됐던 팁들 제가 이번에 문제없이 넘어갈 수 있었던 건 다음과 같은 이유 덕분입니다. 1️⃣ 전문 세무사의 도움을 받아라 개인사업자든, 법인이든 세무사와 함께 하면 이런 상황에도 바로 대처할 수 있습니다. (특히 종합소득세 신고 시즌에는 세무사님이 정말 든든합니다.) 2️⃣ 크리에이터 자동입금 서비스 (신한은행) 사용하기 개발자나 크리에이터라면 수익 관리가 복잡할 수 있는데, 저는 신한은행의 ‘크리에이터 자동입금 서비스’를 사용하고 있어서 수익 관리가 깔끔히 정리되어 있었어요. 이것 덕분에 신고할 때 편리했습니다. 3️⃣ 해외 법인이 반드시 필요하지 않다면, 국내 솔루션 이용하기 사실 해외 법인이 꼭 필요한 상황이 아니라면 국내에서 편하게 결제 시스템을 구축할 수 있는 솔루션이 많습니다. 개인적으로는 래피드(Latpeed)나 토스페이먼츠 같은 서비스가 제일 현실적이고 추천할 만합니다. 개인사업자, 복잡한게 싫다면 레피드를 추천 드리고 직접 개발 핸들링 가능하고 법인사업자 같은 경우에는 토스 추천드립니다. 물론, 해외 법인 설립 및 핸들링 가능하실 경우에는 Stripe Atlas나 LemonSqueeze 추천 드립니다. 해외 법인, 꼭 필요한가요? "정말 특별한 이유가 없다면 해외 법인은 불필요하게 복잡할 수 있다."

Haebom

2025/06/03 9:38 PM

바이브 코딩 삽질기 EP.01

최근에 올렸던 바이브코딩(Vibe Coding)에 관한 글이 예상보다 큰 관심을 끌었습니다. 많은 분들이 성공담에만 주목하셨는데, 사실 이 과정에서 겪었던 여러 가지 시행착오와 실패 사례도 있습니다. 오늘은 그중에서 제가 경험한 흥미로운 '삽질기' 하나를 여러분과 공유하려고 합니다. 제가 당시 개발했던 서비스는 "PDF AI SHIELD"라는 이름을 가진 PDF 보호 시스템이었습니다. 최근 확산되는 LLM(대규모 언어 모델)들이 PDF 문서를 쉽게 읽고 요약해버리는 현상이 늘면서, 이를 막기 위한 방안으로 떠올렸던 아이디어였죠. 대학에서 학생들에게 자료를 나눠주거나 공문서 등을 열심히 작성해서 공유 했을 때 모두 인공지능으로 요약해 읽고 오니 뭔가 이걸 어떻게 제한 하지 라는 생각이 들었습니다. LLM이 우리가 제공하는 다양한 문서, 데이터를 정리 요약하는 법은 간단합니다. LLM은 문서를 읽고 → 중요 포인트를 찾고 → 묶고 → 짧게 말하고 → 출력 하는 과정을 거쳐 우리에게 정보를 제공합니다. 이 과정에서 저는 "읽기" 단계에 개입하여 LLM이 아예 chunking을 하지 못하게 방해하는 방식을 고안했습니다. 일반적인 PDF 보안은 비밀번호나 인증서, OCR 제거와 같은 방법을 사용하는데, 저는 여기에 특별한 방법을 추가했습니다. 그 방법이 바로 "보이지 않는 페인트"를 PDF에 뿌리는 것이었습니다. 사람이 보기엔 전혀 이상이 없지만, LLM의 눈에는 이를 읽을 수 없게 방해하는 일종의 "투명한 페인트"를 문서에 추가한 겁니다. 이외에도 인증서 형태의 태그와 PDF 메타데이터를 암호화하여 LLM이 쉽게 읽어내지 못하도록 조치했습니다. 기술적으로는 생각보다 훌륭히 작동했습니다. ChatGPT, Claude와 같은 유명한 LLM을 포함해 로컬 LLM 모델들까지 모두 이 방법에 막혔습니다. 처음 결과를 봤을 때는 거대 AI 기업들을 상대로 작은 승리를 거둔 듯한 기분마저 들었습니다. 이 자신감을 바탕으로 가격 정책을 정하고, Reddit과 몇몇 해외 커뮤니티에 홍보도 진행했습니다. 생각보다 빠르게 구매자들이 나타났고, 금세 성공적인 비즈니스로 자리 잡을 것 같았습니다. 솔직히 이 시점에서 조금 들떠 있었던 것도 사실입니다. 비즈니스 모델은 다음과 같이 구성했습니다. 비로그인 상태에서는 최초 1회 무료 사용 로그인하면 하루에 1회씩 사용 가능(24시간 기준) 월간 구독 시 하루 최대 30회 사용 가능 연간 구독 시 무제한 사용 가능 그런데 얼마 지나지 않아 예상치 못한 문제가 발생했습니다. GPT-4o, Claude Sonnet 3.5, Gemini Pro와 같은 모델에선 잘 작동했지만, 최신 모델인 o3나 Sonnet 3.7에서는 이 보호 기술이 완전히 무력화되었습니다. 더군다나 mini 모델이나 특정 조건에서는 메타데이터 암호화까지 뚫리는 경우가 발생했습니다. 다행히 초기 사용자 중 한 분이 친절하게 이 문제를 제보해 주셨고, 저는 즉각적으로 모든 구매자들에게 환불을 진행했습니다. 보안이라는 서비스의 특성상 단 한 번이라도 뚫리면 제품을 계속 판매할 수 없었기 때문입니다. 초기에 얻은 수익은 결제 수수료 등으로 인해 오히려 적자가 되어버렸지만, 빠른 조치 덕분에 더 큰 손실을 막을 수 있었습니다. 이걸로 보안 관련 소송 걸리는 것보다는 훨씬 낫잖아요? 제가 괜히 입금까지 완료된 것이 수익이라고 한 게 아닌 이러한 경험담을 몇 가지 더 가지고 있습니다. 반응이 좋다면 앞으로 더 다양한 이야기를 공유해 볼까 합니다. 사실 바이브 코딩 첫 글에도 말했지만 바이브 코딩을 하다 보면 우리 생각 이상으로 많은 삽질과 수정이 필요하고 이 과정에서 개발자에 대한 수요가 오히려 더 발생한다고 생각합니다. 그리고 이런 삽질들이 반복되면 더 좋은 제품이 되는 것 같구요. 사람들은 실패담 보다는 성공담과 극적인 것을 더 좋아하는 것 같지만, 개인적으로는 이런 실패담도 꽤 많습니다. 삽질이라고 표현했지만 개인적으로 배운 것도 많고요. 이런 글이 반응이 좋을지 모르겠지만 한 번 반응이 좋으면 2편, 3편도 계속 공유해보겠습니다.

Haebom

2025/05/23 12:11 PM

코칭으로 100명+의 사람을 만나본 간단한 후기

회사를 그만두고 창업을 시작하면서 가장 크게 느꼈던 것은 좋은 자극에 대한 갈구였습니다. 감사하게도 많은 분들의 도움과 시대의 흐름 덕에 밥 굶을 걱정은 없었고 회사는 생각보다 빠르게 안정적인 궤도에 올랐습니다. 그러나 좋은 동료와의 꾸준한 교류에 대한 갈증은 쉽게 채워지지 않았습니다. 1인 사업자로서 몇몇 프리랜서 분들과 원격 근무 형태로 협업하다 보니, 자연스럽게 회사 동료처럼 편안하게 이야기하며 서로 자극을 주고받는 관계가 그리워졌죠. 소중한 인력을 단지 이런 이유로 채용하기엔 부담스럽기도 했고, 간혹 다른 기업에서 주 1회 근무를 해 보기도 했지만, 기대했던 자극이나 영감과는 조금 거리가 있었습니다. 특정 독서모임을 주최하거나 참여해 봤지만 역시나 무언가 부족했습니다. 어릴 땐 여러 사람들과 왁자지껄 모이는 걸 좋아했는데, 이제는 그런 자리에서 오는 피로감도 컸고요. 그러던 중 코칭을 떠올리게 되었습니다. 예전에 애자일 코치 교육을 받으면서 배웠던 기술과 프로그램이 있었기에, 이를 바탕으로 무료로 코칭을 진행해 보기로 마음먹었습니다. 처음에는 대상자를 특정하지 않고, 주로 저연차 직장인이나 취준생을 대상으로 시작했는데요. 시간이 흐르며 놀랍게도 50대, 60대 분들도 찾아와 주셨습니다. 인생의 2막을 준비하거나 이미 활기차게 달리고 계신 분들이셨죠. 한 번은 소형 선박을 제작하는 분과 만나 이야기를 나누었습니다. 그분은 거제에서 20톤 미만의 소형 선박을 전문으로 제작하는 조선소를 운영하고 계셨습니다. 알루미늄과 이름도 어려운 섬유강화플라스틱을 결합한 하이브리드 선박을 만들며, 선주의 세세한 요구사항에 따라 배의 상부 구조물을 맞춤형으로 제작하는 방식이 매우 인상적이었죠. 저는 그때까지 부산, 인천, 강릉을 여행하며 수없이 많은 배를 보았지만, 배를 누가 어떻게 만드는지에 대해서는 생각해 본 적이 없었거든요. 이렇게 작은 조선소들이 큰 조선소와는 다른 방식으로 유연하게 고객 맞춤형 제작을 한다는 사실을 알게 되니 새로운 세상을 엿본 기분이었습니다. 그리고 여기서 어떤 식으로 수수료를 받고 각 비용이 대략적으로 얼마 드는지도 무척 재밌는 소재였습니다. 어떤 날에는 현직 간호사 분들과 이야기를 나누면서 '마이듀티'라는 앱을 알게 되었습니다. 마이듀티는 간호사들이 자신의 복잡한 교대 근무 일정을 효율적으로 관리하고, 동료들과 손쉽게 공유할 수 있도록 도와주는 도구였습니다. 이 앱의 가장 큰 장점은 같은 병동 내 동료들의 근무표를 한눈에 볼 수 있다는 점이었죠. IT 업계에서 일하면서도 전혀 몰랐던 서비스였고, 특정 직업군의 니즈를 정확히 파악해 탄생한 이 앱은 제게 큰 영감을 주었습니다. 글로벌도 진출해서 많이들 사용하고 이제는 없으면 안되는 앱이 되었더라구요. 언제는 만도(Mando)에서 근무하시는 이분을 통해 자동차 한 대가 만들어지기 위해 얼마나 복잡하고 정밀한 협력 구조가 필요한지를 배우게 되었습니다. 만도는 자동차의 제동, 조향, 현가 장치 등 운전자 안전과 직결된 핵심 부품들을 개발하고 생산하는 기업입니다. 우리가 매일 타고 다니는 자동차 한 대에도 이렇게 수많은 부품과 기업들이 촘촘히 엮여 있다는 사실은, 보통 하나의 제품을 전체적으로 만드는 방식으로 일해온 IT 분야의 제게는 굉장히 신선한 자극이었습니다. 개별 부품을 전문적으로 제작하고 각 기업이 유기적으로 협업해 최종 제품을 완성하는 제조업의 방식은, 제가 평소 경험한 협업의 형태와 전혀 다른 매력을 보여주었습니다. 물론, 머리로는 그렇게 만들어진다는 것을 알고는 있었지만 실제로 그 일을 하고 산업에 종사하는 분의 이야기를 직접들으니 더욱 색달랐던 것도 있습니다. 이렇게 꼬치코칭을 통해 수많은 분야의 분들을 만나면서 제가 보는 세상이 점점 넓어지고 깊어짐을 느꼈습니다. 단지 사람들을 만난 것이 아니라, 다양한 삶과 경험을 통해 세상을 이해하는 시야가 넓어진 느낌이었죠. 때로는 만난 분들끼리 서로 연결해 채용이 이루어지기도 하고, 사업적인 협업이 시작되기도 했습니다. 생각지도 못한 곳에서 뜻밖의 영감을 받을 때는 그 자체로 저에게 큰 기쁨이었습니다. 많은 사람과의 대화는 결국 한 가지를 깨닫게 해주었습니다. 제가 알고 있다고 생각한 세상은 너무나 좁고, 우리가 서로의 이야기를 나눌 때 비로소 넓고 다채로운 세상이 보인다는 사실을요. 앞으로도 저는 꼬치코칭을 통해 더 많은 사람과 만나고, 더 많은 이야기를 엮으며 서로의 삶을 더욱 의미 있게 연결하고자 합니다. 한 분, 한 분 뵙다 보니 누적이 아닌 개개인으로 100분을 넘게 만나게 되었고 이건 엄청난 자산이 되었네요. 밥값과 커피값이 많이 들었지만 그 이상의 가치를 했다고 생각합니다. 앞으로는 더 체계적으로 만나보면 좋겠다는 생각을 하며 이만 줄입니다.

Haebom

2025/05/20 6:32 PM

인간은 정의를 어떻게 확신할 수 있을까?

지난 주말, 판사를 하셨고 다양한 사건과 사례를 경험하신 판사 부부 댁에 가서 즐거운 시간을 보냈습니다. 두 분은 모두 판사의 법봉을 내려 놓으시고 지금은 변호사와 전원 생활을 하고 계시는데 밤이 깊어지고 모닥불을 피우며 다양한 이야기를 하다가 저의 호기심으로 '판사는 공명정대한가?'에 대한 발칙한 질문으로 시작해 어떻게 그것을 훈련하고 확신할 수 있는지에 대해 이야기가 확장되었습니다. 이후, 틈틈히 이 생각을 정리해보고 있는데 물론 저는 법률가는 커녕 시민으로서 최소한의 법 지식만 있을 뿐 입니다. 제가 유일하게 법에 대해 공부했던 것은 고등학교 1학년 <법과 사회>라는 과목이 전부였습니다. 저도 신문기사나 기존에 생각하는 것들에 대해 작성해 본 것이니 너그러히 읽어주시면 감사하겠습니다. 전세계에서 발생하는 사법 지연 "지연된 정의는 정의의 부재(Justice delayed is justice denied)" 이 오래된 격언이 지금 전 세계에서 현실화되고 있습니다. 사법부에 대해 이것 저것 알아보다 보니 영국의 사례가 눈에 띄였습니다. 유럽에서 한국까지 사법부가 사건 적체와 재판 지연으로 몸살을 앓고 있습니다. 특히 영국과 유럽에서는 심각한 재판 지연 사례가 속출하며 사법 시스템 자체가 마비될 위기에 처했습니다. 영국 법무부 발표에 따르면, 2016년 약 4만 8천 건에 불과했던 법원 사건 적체는 2024년 현재 7만 건 이상으로 증가했습니다. 심지어 런던에서는 칼로 위협한 피고인의 단 3일짜리 재판 일정이 2028년으로 잡힌 사례가 발생하며 사회적으로 큰 파장을 낳았습니다. 유럽 전반적으로 사법 시스템의 투자가 만성적으로 부족한 상태인데, 유럽평의회의 조사에서는 유럽 각국의 사법 예산이 GDP 대비 0.31% 수준으로 10년간 실질 감소했다고 지적했습니다. 포르투갈 리스본에서는 법원 직원들의 잦은 파업으로 재판 업무가 마비되는 사례가 빈번히 발생하고 있습니다. 프랑스, 스페인은 말할 것도 없고... 미국도 최근 여러 몸살을 앓고 있습니다. 한국의 사법부 역시 위기를 겪고 있습니다. 법률신문의 조사에 따르면 대한민국 판사 1인당 연간 사건 처리량이 독일의 5배, 일본의 3배 수준입니다. 대법관 12명이 매년 약 4만 건의 상고 사건을 처리하는 상황에서 잦은 판사 인사 이동은 사건의 연속성과 공정성을 크게 저해하고 있습니다. 최근 헌법재판소와 대법원에서도 정치적 이슈로 이목이 몰리면서 사건 적체가 심각해졌고, 이는 결국 국민의 재판청구권과 권리구제에 실질적 피해를 주고 있습니다. 뭐, 이런 교과서적 말이 아니더라도 사법부를 인공지능으로 대체한다? 국회가 지난해 말 판사를 370명 증원하는 법안을 통과시켰지만, 단순히 인원을 늘리는 것으로 근본적 문제 해결은 어렵다는 지적이 많습니다. 오히려 사법 시스템 자체의 구조적이고 효율적인 개혁이 필요하다는 목소리가 높습니다. 이런 상황에서 최근 판사의 역할을 인공지능으로 대체하면 공정한 판결이 가능하다는 주장이 나오고 있습니다. 하지만 이는 큰 착각입니다. 인공지능은 오히려 기존의 편향성을 증폭할 가능성이 크며, 최근 딥러닝 기반의 초거대 인공지능 모델은 내부 작동 원리가 블랙박스와 같아 편향의 원인을 추적하기조차 어렵습니다. 결국 판결을 내리는 존재의 문제는 불완전성이 아니라, 판결의 일관성에 있다고 봐야 합니다. 사법부가 존재하는 가장 근본적인 이유는 명확한 원칙과 철학 아래 일관된 판결을 내릴 수 있도록 우리가 권한을 신뢰하고 맡겼기 때문입니다. 그런데 최근 민의나 다수의 의견이라는 이름으로 판결의 철학과 기본 논리 자체가 흔들리는 사례가 자주 나타나고 있습니다. 이는 법치사회가 서서히 무너지는 시작일 수 있습니다. 과잉 입법으로 야기된 사법 혼란 한국의 문제 중 하나는 과잉 입법입니다. 우리나라는 1년에 제정되는 법률의 수가 다른 국가에 비해 압도적으로 많습니다. 법률이 지나치게 많아지면, 해석의 여지가 좁아지고 다양한 사회적·경제적 활동이 위축됩니다. 법률 간 상충되는 경우도 빈번히 발생하여 기업과 시민이 법을 지키는 것 자체가 어려워지는 역설적 상황이 연출됩니다. 이런 문제를 해결하기 위해 필요한 것은 오히려 입법부의 디지털화입니다. 인공지능이 판사를 대체하거나 보조하기보다는, 입법 단계에서 법률 간 충돌 여부와 사회적 영향을 충분히 데이터로 검토하는 시스템이 필요합니다. 현재처럼 같은 당이나 동료 의원의 요청에 따라 법안을 지지하는 관행을 개선해야 하며, 초기에는 블라인드 평가로 법안의 내용을 객관적으로 평가하고, 이후에 기명 투표로 책임성을 높이는 방식도 고려해볼 만합니다. 결국 정의는 사치품이 아니라 우리가 반드시 지켜야 할 필수적인 가치입니다. 사법부의 일관성과 독립성을 지키기 위한 근본적이고 체계적인 개혁과 함께, 입법부의 디지털화를 통해 보다 투명하고 효율적인 법률 체계를 구축하는 것이 지금 우리가 직면한 위기를 극복하는 현실적인 길이 될 것입니다. 국가 의원 당 연간 평균 발의 법안 수 전체 연간 발의 법안 수 의원 발의 비율(%) 정부 발의 비율(%) 법안 통과율(전체)

Haebom

2025/05/14 1:16 AM

논문 게재 확정 : 인공지능 기억 구조 관련 연구

최근 한국인공지능학회(https://kjai.jams.or.kr/)지에 논문이 Accept(게재 확정) 나서 공유 드립니다. Pre-print형태로 이전에 Arxiv에 업로드 되었던 논문인데 이름은 거창하게 HEMA로 지었습니다. 사실 뇌의 한 부분인 해마에서 따온 이름입니다. 뇌의 해마는 기억과 학습을 관장하는 중요한 역할을 수행하는 구조물입니다. 특히 새로운 사실을 기억하고 공간을 탐색하는 데 중요한 역할을 하며, 편도체와 상호작용하여 감정적인 기억을 형성하는 데에도 관여합니다. 해당 논문의 핵심은 LLM에서 Long-Context 그러니까 긴 대화를 할 경우 품질이 떨어지는 것을 방지하는 연구인데요. 간단하게 이야기 하면 인간이 어떤 사건, 상황을 기억할 때, 모든 것을 세세하게 기억하지 않는 것 처럼 일반적으로 요약해 기억하는 것을 Compact Memory라는 형태로 text 형태로 저장하고, 인간의 경우 상징/신호 등을 메인으로 기억하는 것을 포인트로 잡아 사전에 나눴던 대화를 Vector DB형태로 보존하여 Vector Memory 로 가지고 갑니다. 이럴 경우 긴 대화로 좀 더 오래 맥락을 유지하면서 동작이 가능하고, 일관성 있는 경험이 가능합니다. 이후 소설, 반려챗봇 등을 운영하는데 잘 사용할 수 있을 것으로 보이고 완전 재현 방식으로 실험을 해서 sLM으로 반복적 실험을 했습니다. 일단은 영어기준이고 6b 기준으로도 성능이 잘나오는 걸 보면 이미 서비스화 되어 있는 Claude나 ChatGPT에서는 더 잘 작동할 것 이구요. 보통은 Claude 같은 것을 사용할 때 대화가 너무 길어서 다른 대화로 옮겨야 하거나, ChatGPT에서도 대화가 길어질 때 성능이 저하되는 경우가 있었는데 최근에는 이것을 Project 기능이나 Memory 기능 등으로 해결하려는 게 보입니다. 이전까지는 프롬프트를 통해 "이전까지 대화를 요약 정리해줘" 같은 방식으로 한 번 정리 시키고 새로운 이야기를 시작했던 것과 유사하죠. KCI, SCI에 논문을 계속 내어 보고 있는데 허들이 높아진게 느껴집니다. 타율이 예전 같지 않네요. 가장 번거로운 것은 회사에 있었을 때는 회사 자원으로 연구를 풍족(?)하게 할 수 있었다면, 지금은 빠듯하게 사비로 해야한다는 점이 있습니다. 후속 연구를 통해 문체를 유지하며 중복된 내용이 없으며 균질하게 결과물을 내는 것에 대해 하나 준비 중인데 이것도 성과가 나오면 공유 드려보도록 하겠습니다.

Haebom

2025/05/13 12:55 PM

누가 휴머노이드 로봇을 만드는가?

수 년전, LG전자 로봇 부분에서 일하던 동생이 마키나락스로 이직을 한다고 했을 때가 아마 제가 로봇 산업에 대해 처음 자세히 들여다 본 시작이였을 겁니다. 그 전까지 뭐 로봇청소기, 로봇팔 등을 사용해보고 이용해본적은 있지만 이걸 누가 어떻게 만들고 어떤 식으로 작동하는지 궁금해 했던 것은 처음이였습니다. 그리고 그 관심은 오래가진 못했습니다. 어릴 때, 아두이노로 간단한 반복작업을 하는 로봇을 만들거나 라즈베리파이로 인식해서 장애물 피하는 로봇 정도 만들어 본게 전부였던 저로서는 사실 좀 어렵기도 했었고, 당시 카카오브레인으로 이직을 앞두고 공부할게 많아서 깊게 생각은 못해봤었습니다. 그러다, 2023년 무렵 한 논문을 봤는데 Multimodal을 이용해 로봇팔을 학습시켜 특정 가사노동을 수행할 수 있게 하는 시연이 포함되어 있었습니다. 이후 이런 논문은 수도 없었지만 당시에는 매우 인상적이였습니다. 이후, 테슬라의 옵티머스나 피규어01 같은 모델을 보면서 휴머노이드가 완전 말도 안되는 이야기는 아닐지도? 하는 생각이 서서히 들기 시작했죠. 사실 제조 공장에 가보면 로봇팔(robotic arm, mechanical arm)은 생각 이상으로 정교하게 잘 만들어집니다. 제가 직접 본 게 H기업 조선소였는데 그때가 2023년이였으니 지금은 더 발전했을 거라 생각합니다. 그리고 이 분야에서 잘하고 있는 국내 기업들도 많구요. 휴머노이드의 경우에는 약간 다릅니다. 로봇팔은 결국 선이 꽂혀 있기에 전력을 꾸준히 공급받고 복잡한 컴퓨팅 계산을 하는데 상대적으로 빠르고 수월합니다. 다만 휴머노이드의 경우, 완전히 독립되어 움직이기 때문에, 배터리 부터 연산 능력까지 챙겨야할 게 많죠. 사실 그래서 무척 요원한 이야기라고 생각했습니다. 이번 2025년 엔비디아의 Physical AI 세션을 보기 전까진 말이죠. 사실 3월 부터 정리했던 것인데 미루다 보니 이렇게 게시가 늦어졌습니다. 지난 데이터 센터와 같은 포멧으로 작성해 보았습니다. 사실 위와 같이 휴머노이드 로봇에 대해 각종 컨설팅사에서 정리 해놓은 자료를 보면 보통 휴머노이드의 분야? 구동계?를 12개 정도로 나누는 것 같습니다. 머리 (Head), 어깨 (Shoulder), 팔꿈치 (Elbow), 허리 & 골반 (Waist & Pelvis), 손 (Hands), 상완 (Upper Arm), 전완 (Forearm), 허벅지 (Thigh), 종아리 (Calf), 발 (Feet), 배터리 팩 (Battery Pack), 기타 (Others) 이렇게 12개 분야인데 물론 저도 공부하는 입장이라 반박시 당신이 옳습니다. 2024년 약 32억 8천만 달러 규모에서 2032년에는 660억 달러로 확장될 것으로 전망되는데, 이는 연평균 45.5%의 성장률에 해당합니다. 게다가 최근 몇 년간 제조 비용이 40%나 급감하며 예전 예상치(연 15–20% 감소)를 훨씬 뛰어넘었고, 덕분에 산업용 적용과 투자 시기가 한층 앞당겨진 모습입니다. 저는 전체 12개 핵심 부품 카테고리를 하나하나 살펴보면서, 특히 가치가 높은 영역에 초점을 맞춰 투자가치를 매핑해보았습니다. 손의 중요성: 정교한 조작이 가치 사슬을 주도하다 제가 가장 눈여겨본 건 ‘손’ 부품입니다. 로봇 한 대당 이 부품 비용이 9,500달러(전체 비용의 17.2%)로 단연 최고죠. 덕분에 2032년까지 약 35억 달러 규모의 전용 시장이 형성될 전망입니다. 인간만큼 섬세하면서도 튼튼해야 하는 기술적 난도가 이 시장을 키우고 있습니다. Novanta Inc. (NASDAQ: NOVT): 엔드이펙터 기술과 다축(force/torque) 센서 제공 FANUC Corporation (TYO: 6954): 6축 힘 감지 센서 제조 Teradyne Inc. (NASDAQ: TER): Universal Robots 인수 후 엔드이펙터 솔루션 강화 Shadow Robot Company: 24자유도, 20개 구동 모터, 100여 개 센서를 갖춘 Dexterous Hand SCHUNK GmbH: 모듈식 그리핑 시스템 Figure AI: 2024년 2월, 6억 7,500만 달러 투자 유치(기업가치 26억 달러) 제가 특히 주목한 건 인체 피부를 모사한 다층 촉각 센서와 텐던 구동 시스템입니다. 이 두 가지가 좁은 공간에서 더 많은 자유도를 실현하면서, 촉각 센서 시장은 2030년까지 355억 달러에 이를 거라고 합니다. 이런 촉각센서는 휴머노이드 말고 다양한 곳에서 사용 될 거라는 생각이 들더라구요. 하체 부품: 이동성과 안정성의 기반 허벅지·종아리·발 부품은 휴머노이드 전체 비용의 38.6%를 차지합니다. 이른바 다리 부문은 로봇의 ‘걸음걸이’를 결정짓기에 투자 기회가 큽니다. 허벅지·종아리의 경우 2024년 기준, 시장규모 각 4억 3,300만 달러 → 2032년 87억 1,000만 달러로 빠른 성장을 예측하고 있고 이것을 지면과 연결하는 발 부분도 2025년 8~9억 달러를 예상한다고 합니다. Emerson Electric, Thomson Industries(Altra Industrial Motion): 고부하 선형 액추에이터 MISUMI Group: 정밀 기계 부품 Bosch Rexroth: 고출력 전동 액추에이터 Agility Robotics: Digit 2족 보행 로봇용 액추에이터 Figure AI: 차세대 하체 액추에이터

Haebom

2025/05/07 6:11 PM

(내가 아는) 바이브 코딩에 대한 모든 것

"AI를 활용해서 월 천만원은 쉽게 벌었어요!" "인공지능으로 수억 원의 부수입을 올렸습니다." 스레드나 인스타그램, 카카오톡을 열 때마다 인공지능으로 수익을 올렸다는 화려한 성공담들이 쏟아집니다. 매일같이 올라오는 글을 보며, 솔직히 부러움보다는 의구심이 먼저 들었죠. 제 주변에는 AI를 연구하거나, 직접 모델을 개발하는 사람이 많은 편인데 실제 기술을 개발하거나 서비스를 구축하는 사람들보다는 아이러니하게도 인공지능 강의를 하시는 분들이 더 빠르고 큰 수익을 올리는 것처럼 보였습니다. 오랫동안 IT로 밥벌이를 해왔지만, 제가 경험한 현실은 그렇게 드라마틱하지 않았거든요. 그러던 중 지난해부터 호기심 반, 재미 반으로 인공지능 코딩 도구를 이것저것 사용해보기 시작했습니다. 처음엔 단순히 유지보수나 작은 스크립트 작성 정도로만 쓰던 도구들이, 어느 순간부터는 예상 밖의 수익을 가져다 주기 시작했죠. 이걸 좀 더 체계적이고 목적성 있게 하면 바로 안드레이 카파시(Andrej Karpathy) 명명한? '바이브 코딩(Vibe Coding)'입니다. 지난 몇 달 간 저는 Cursor, Replit, Trae, V0, Copilot 등 다양한 AI 코딩 도구들을 써보면서, 최근엔 Windsurf와 Lovable 같은 툴도 써보고 있습니다. 직접 써보니 도구마다 분명한 특성과 차이가 있더군요. 코딩 경험이 전혀 없는 사람이 빠르게 프로토타입을 만들어낼 때 유리한 '콜드 스타트(Cold Start)' 도구와, 이미 어느 정도 코딩을 할 줄 아는 사람이 생산성을 폭발적으로 끌어올릴 때 좋은 '부스팅(Boosting)' 도구로 나눌 수 있다는 사실도 알게 되었습니다. 물론 제 마음대로 나눈 것이라 아무런 의미가 없습니다! 도구 분류 주요 특징 한 줄 평 Lovable 콜드 스타트 프론트엔드, 디자인, 백엔드 통합 자동화 Supabase(데이터베이스) 및 이메일 통합 IT인이고 아이디어가 명확할 때 쓰기 좋음. Replit 콜드 스타트/부스팅 브라우저 기반 개발 환경 배포 및 오토 스케일링, 호스팅 모바일 앱으로 사용 가능

Haebom

2025/05/05 9:02 PM

인공지능과 소통하기: 엔진 레이어와 인터랙션 레이어의 균형 잡기

여러분이 식당에 갔다고 상상해 볼까요? 한 식당에서는 메뉴판을 받고, 다른 식당에서는 메뉴 없이 웨이터와 자유롭게 대화해야 합니다. 메뉴판이 있으면 쉽게 주문할 수 있지만, 메뉴판에 없는 주문은 어렵죠. 반면 웨이터와의 자유로운 대화는 가능성은 무한하지만, 무엇을 어떻게 요청해야 할지 고민해야 합니다. 오늘날 우리가 인공지능(AI)과 소통하는 방식도 바로 이 두 가지 방식으로 나뉩니다. 이전 글에서 다룬 대로, 효율성과 성능 중심의 LLM(Large Language Model) 기반 인터페이스가 있다면, 인간 경험 중심의 인터페이스도 필요합니다. 이 두 가지 접근법은 서로를 배제하는 게 아니라, 각각 엔진 레이어와 인터랙션 레이어라는 별도의 층에서 공존할 수 있습니다. 아래 글에서 이어 작성되는 글 입니다. 1. 엔진 레이어: 프롬프트 관리와 모델 최적화의 세계 앞서 파인튜닝에 관한 글에서 언급했듯이, 인공지능을 효과적으로 활용하기 위해서는 엔진 레이어에 대한 이해가 필수적입니다. 이 레이어는 생성형 AI의 성능과 효율성을 극대화하는 데 초점을 맞추고 있습니다. 제가 운영하는 3blocks.ai를 통해 다양한 기업들의 AI 도입을 지원하면서 발견한 사실은, 많은 기업들이 "인공지능 좀 써보자"라는 간단한 생각으로 시작하지만, 실제로는 그 도입 과정이 결코 간단하지 않다는 점입니다. 특히 폐쇄망 환경에서는 단순히 API를 가져다 쓰는 것이 아니라, 데이터 전처리부터 모델 서빙까지 전 과정을 직접 구축해야 하는 경우가 많습니다. 엔진 레이어에서 중요한 것은: 프롬프트 관리: PromptHub나 LangSmith 같은 도구를 통해 프롬프트를 Git 코드처럼 버전 관리하고 최적화합니다. RAG(Retrieval-Augmented Generation): 관련 정보를 검색하여 모델의 응답을 증강하는 기술로, 기업 내부 데이터와 LLM을 효과적으로 연결합니다. 파인튜닝: 특정 도메인이나 업무에 맞게 모델을 추가 학습시키는 과정으로, 법률 문서 요약이나 의료 기록 분석 같은 전문 분야에 활용됩니다. 다만, GPT-4o의 시스템 프롬프트를 살펴보면서 깨달은 점은, 실제 연구 분야에서도 프롬프트는 그리 복잡하지 않다는 것입니다. 어떻게 출력하는지 양식을 정하는 정도를 '엔지니어링'이라 부르기엔 민망한 면이 있죠. 결국 중요한 것은 현란한 프롬프트 기법보다는 실제 문제 해결에 적합한 접근법을 찾는 것이라고 생각합니다. 2. 인터랙션 레이어: 사용자 중심의 경험 설계 반면, 인터랙션 레이어는 사용자가 AI와 어떻게 소통하고 작업하는지에 초점을 맞춥니다. 인텔의 사례에서 볼 수 있듯이, AI 기술 수용에 있어 경험이 미치는 영향은 상당합니다. 사용 경험이 있는 사람의 64%가 다음 업그레이드에서도 AI PC를 고려한 반면, 경험이 없는 사람들 중에서는 32%만이 긍정적인 태도를 보였죠. 직관적인 인터페이스 제공은 복잡한 AI 기술을 일반 사용자도 쉽게 활용할 수 있게 하는 핵심입니다. 마치 슬랙(Slack)이 IRC의 기능을 일반 사용자도 이해하고 사용할 수 있는 통합 소프트웨어로 재탄생시킨 것처럼, AI 인터페이스도 그러한 변혁이 필요합니다. 인터랙션 레이어에서 주목할 점은: 시각적 흐름과 맥락: Miro나 Tana처럼 사용자의 사고를 시각적으로 확장할 수 있는 인터페이스 설계 접근성 있는 UI: 복잡한 명령어 대신 직관적인 버튼과 메뉴 구조 맥락 유지: 사용자의 작업 맥락을 이해하고 기억하는 지속적인 상호작용 최근에 많은 주목을 받은 Ideogram AI처럼 타이포그래피나 로고 디자인 같은 특화된 영역에서 인터랙션 레이어의 중요성은 더욱 두드러집니다. 기술의 복잡성을 감추고 창의적 표현에 집중할 수 있게 하는 인터페이스가 사용자 경험의 핵심이죠. 3. 하이브리드 인터페이스의 미래 그렇다면 이 두 레이어는 어떻게 만나야 할까요? 이상적인 하이브리드 인터페이스는 다음과 같은 구조를 가져야 한다고 생각합니다:

Haebom

2025/05/05 12:07 PM

메타(Meta)의 첫 번째 LlamaCon 2025을 보며

지난 몇 년간 생성형 AI 분야에서 가장 주목받은 이름 중 하나는 단연 메타(Meta)의 Llama 시리즈일 것입니다. 그런 메타가 올해 처음으로 LlamaCon이라는 이름의 대규모 컨퍼런스를 개최했습니다. 이번 컨퍼런스에서는 메타가 생각하는 AI의 미래 방향과 비전을 확실히 엿볼 수 있었는데요. 제가 직접 참여하면서 얻은 인사이트를, 공식 발표된 내용과 함께 정리해서 공유드립니다. 모바일 앱으로 일상에 더 가까워진 Meta AI LlamaCon 2025에서 가장 눈길을 끈 발표 중 하나는 바로 Meta AI 독립형 모바일 앱 출시였습니다. 이 앱은 최신 모델인 Llama 4를 기반으로 하며, 텍스트와 음성 기반의 자연스러운 대화는 물론, 이미지 생성 및 편집 기능까지 제공합니다. 메타의 다양한 플랫폼 데이터와 연동되어 각 사용자에게 개인화된 디스커버 피드까지 제공합니다. 특히 흥미로웠던 점은 이 앱이 Ray-Ban의 스마트 글래스와 통합된다는 발표였습니다. 스마트 글래스를 통해 AI 어시스턴트를 언제 어디서나 자유롭게 활용할 수 있다는 점에서, 메타가 웨어러블 AI 시대의 가능성을 본격적으로 열었다고 볼 수 있습니다. 12억 회 다운로드 돌파: 오픈소스 AI의 성공 방정식 Llama의 인기는 이미 입증되었습니다. Llama 시리즈는 출시 약 2년 만에 무려 누적 다운로드 12억 회라는 기록을 세웠습니다. 2024년 12월 6.5억 회 2025년 3월 10억 회 최근 12억 회 돌파 이 놀라운 성장의 비결은 메타가 채택한 오픈소스 전략과 강력한 커스터마이징 기능 덕분이라고 할 수 있습니다. 앞으로 더 많은 개발자와 기업들이 이 오픈소스 AI 생태계에 뛰어들 것으로 보입니다. Llama API 출시: 오픈소스와 API의 완벽한 결합 이번 컨퍼런스에서 개인적으로 가장 관심 있게 본 발표가 바로 Llama API의 공개였습니다. 제한된 프리뷰 형태로 제공된 이 API는 개발자들이 간편하게 Llama 모델을 호출하고 커스터마이징할 수 있게 돕습니다. Python과 Typescript SDK 지원 OpenAI SDK와 완벽 호환 Cerebras 및 Groq와 협력하여 빠른 추론 환경 제공 자체 데이터로 미세조정(fine-tuning)까지 가능 특히 메타가 강조한 점은, 개발자가 만든 커스텀 모델과 그 가중치를 완전히 사용자 소유로 인정한다는 것입니다. 이는 데이터 및 모델 주권에 대한 중요한 메시지로 받아들여지고 있습니다. Llama Stack의 기업 환경 확대 메타는 Llama Stack을 엔터프라이즈급 AI 솔루션으로 발전시키기 위해, NVIDIA NeMo, IBM, Red Hat, Dell과 같은 글로벌 기업들과의 협력 확대를 발표했습니다. 이 파트너십은 기업들이 다양한 환경에서도 Llama를 손쉽게 운영할 수 있도록 하는 것을 목표로 합니다. 이는 특히 보안과 성능, 비용 효율성을 모두 갖춰야 하는 금융, 의료, 공공기관 등에서 큰 관심을 받을 전망입니다. 최근 아래와 같은 뉴스를 봤는데 이것도 이런 행도의 일환일까 하는 생각도 들었습니다. 보안까지 신경 쓴 오픈소스 AI 생태계 구축 오픈소스 모델 사용 시 가장 큰 걱정거리 중 하나가 바로 보안 이슈입니다. 메타는 이번 발표에서 이러한 우려를 해결할 다양한 보안 도구들을 공개했습니다.

Haebom

2025/04/30 12:03 PM

구글의 재밌는 실험실

예전에 구글의 도전에 대해 인상이 깊어 위와 같은 글을 작성했었는데, 종종 그래서 구글이 뭘 하고 있습니까?라고 물어보시는 분들이 있습니다. 잘 생각해보니 Gemma3나 Gemini 등도 기존의 모델을 쓰거나 API로 무언가를 만들거나 스튜디오를 사용하는 사람이 아니라면 체감하기 다소 어려울 것 같다는 생각이 들더라구요. 그래서 최근 아래와 같은 사이트를 추천 드립니다. 이름 그대로 구글의 실험실 같은 곳인데요. https://labs.google/ 현지인처럼 자연스럽게 말하는 "슬랭 행(Slang Hang)" 외국어를 배우면 대개 교과서적인 문장을 먼저 배우게 됩니다. 그런데 실제 현지인들은 교과서와는 다르게, 때론 슬랭이나 구어체 표현을 자연스럽게 사용하죠. 이런 점을 보완한 것이 바로 "슬랭 행"입니다. 이 실험에서는 현지인들의 실제 대화 흐름을 한 메시지씩 보면서, 실제로 어떻게 말이 이어지는지를 자연스럽게 배울 수 있습니다. 거리의 상인과 손님의 대화나 지하철에서 오랜만에 만난 친구의 이야기를 따라가면서, 생생한 표현을 익힐 수 있죠. 카메라로 배우는 새로운 단어 "워드 캠(Word Cam)" "워드 캠" 기능은 주변의 사물을 찍으면 AI가 그 사진 속의 물체를 인식하고, 배우고 있는 언어로 라벨을 붙여주는 방식입니다. 예를 들어, 창문은 아는데 블라인드의 단어는 모르고 있었다면, 사진 한 장으로 블라인드와 관련된 표현까지 추가로 학습할 수 있는 셈입니다. 커리어 여정을 설계해주고 관련 직무 추천을 해주는 Career Dreamer 지금 말씀 드리는 것은 극히 일부일 뿐이고 구글의 Labs와 AI Studio를 가보시면 Gemini의 멀티모달을 활용한 다양한 시제품과 사례를 공유하고 있습니다. 다들 OpenAI와 Claude, Deepseek만 좋아하시는 것 같아서 한 번 구글도 매우 매우 잘하고 있다는 의미로 한 번 공유 드려 봅니다.

Haebom

2025/04/30 11:53 AM

일론 머스크의 'DOGE' 실험은 끝났나?

최근 미국에서 가장 뜨거운 논란 중 하나였던 일론 머스크의 ‘정부 효율성부(DOGE, Department of Government Efficiency)’ 실험이 사실상 막을 내리고 있습니다. 이제 머스크는 다시 본인의 본업인 테슬라와 xAI로 복귀하겠다고 선언했는데요. 그의 이런 선언은 도대체 무엇을 의미하며, DOGE는 그동안 어떤 성과와 논란을 남겼을까요? 🚩 DOGE는 무엇이고, 왜 만들어졌나? 일론 머스크가 대선 기간 중 강조한 공약 중 하나는 바로 “정부의 비효율을 줄이겠다”는 것이었습니다. 이를 위해 정부 내 전례 없던 새로운 조직을 창설했죠. 이름하여 정부 효율성부(DOGE). 네, 이 이름은 그의 유명한 ‘도지코인(Dogecoin)’에 대한 애정 어린 농담이기도 했습니다. 그의 초기 공약은 놀라웠습니다. 2조 달러에 이르는 엄청난 정부 예산 절감을 약속했고, 많은 지지자들의 박수를 받았습니다. 하지만 이 약속은 얼마 지나지 않아 현실적인 문제들과 마주하게 됩니다. 📉 예상과 현실의 괴리: 약속한 성과는 이뤄졌나? DOGE가 실제로 성과를 냈는지 확인하기 위한 Wall of Receipts(영수증 벽)이란 웹사이트가 공개됐습니다. 여기서는 머스크의 절감액이 투명하게 공개될 것이라고 했습니다. 하지만 현실은 달랐죠. 최초 2조 달러였던 목표는 불과 몇 달 만에 1조 달러로 축소됐고, 다시 1,500억 달러까지 급격히 낮아졌습니다. 더구나 공개된 영수증에서 계산 착오와 정보 부족이 계속 드러나면서 신뢰도에 큰 타격을 입었습니다. 결국 언론과 전문가들은 DOGE의 성과에 대해 의문을 던졌습니다. 특히 정부감사원(GAO)과 재무부 감사관(OIG) 등에서 본격적인 조사에 들어갔고, 아직 정확한 결과는 나오지 않았지만, 실제 절감액은 발표된 금액보다 훨씬 적을 가능성이 높다는 분석이 지배적입니다. ⚖️ DOGE를 바라보는 두 가지 시선 DOGE에 대한 평가는 현재로서는 극명하게 갈립니다. 긍정적 시선: 머스크의 시도 자체가 의미 있었다고 보는 시각입니다. 방만한 정부 지출과 비효율적인 행정을 조금이라도 돌아보게 만들었다는 평가입니다. 특히 젊은 유권자들이나 머스크 팬들은 그가 기존 정치권이 감히 하지 못했던 문제제기를 했다고 평가합니다. 비판적 시선: 반면 부정적인 입장에서는 DOGE가 “비현실적인 목표”와 “부정확한 숫자”로 오히려 더 큰 혼란과 불신을 초래했다고 봅니다. 공약과 현실의 차이가 너무 컸고, 중대한 국가 예산 문제를 가볍게 다뤘다는 비판이 대표적입니다. 개인적으로는 이게 궁금하더라구요. 미국 정부에게 있어 이게 사기죄 성립이 될까? 테슬라 및 xAI 등의 창업자이자 경영자로 배임죄에 해당하는가? 궁금해서 미국 연방법과 각 주법을 찾아보는데 사기(fraud)에 대한 요건은 아래와 같더라구요. 해당 요건을 DOGE에 적용해보면 이렇습니다. GAO‧OIG 보고서나 청문회에서 이거 밝혀져야 하는데 아무리 빨라도 2025년 8월 늦어도 2025년 연내에 결정이 난다고 하니 한 번 기다려 봐야 할 것 같고... 판단 요소 법적 요건(미국 기준) DOGE 현황 ① 허위 사실인지 객관적으로 틀린 숫자가 제시돼야 함 ‘8 억→80 억’ 등 단위 오류, 계약 종류 오해 등 다수의 계산 착오가 확인됨 ② 고의‧무모성(intent or recklessness) 발표자가 거짓임을 알면서도, 또는 알아볼 수 있었는데도 무시했는지

Haebom

2025/04/29 5:41 PM

최고의 컨디션을 만드는 24시간 사용법

요즘 유튜브에서 매우 자주 보이는 단어가 "뇌과학"입니다. 뇌의 과학적 원리를 이해하여 Life Hacking해서 자신의 삶을 최적화 한다는 것은 무척 매력적인 컨셉 같긴 한데 사실 어느 정도까지 가능한 것인지 잘 감이 안오기도 합니다. 2019년 정도에 주변 사람들에게 메이크타임(Make Time)이라는 책을 엄청 영업하고 다녔는데 그 책에 있었던 내용이 많이 생각 나더라구요. 책 내용에 대한 요약을 주변인들에게 전달했는데 당시 반응이 좋았습니다. 그러던 중 오랜만에 제이크냅과 해외 팟캐스트 이야기를 듣는데 뇌과학까지는 모르겠고 내분비계와 호르몬, 뇌의 특징에 따라 권장하는 루틴이 있더라구요. 우리가 흔히 "시간 관리"라 하면 대부분 할 일 리스트(To-do list)를 생각합니다. 하지만 진짜 효율적인 하루는 단순히 일을 처리하는 것이 아니라, 우리의 뇌와 몸이 가진 자연스러운 리듬에 맞추어 생활하는 것입니다. 그래서 오늘은 최신 뇌과학 연구와 신뢰도 높은 자료를 바탕으로, 가장 이상적인 하루의 시간표를 여러분과 함께 만들어 보려 합니다. 우리가 왜 특정 시간대에 특정 행동을 해야 가장 효율적인지, 이 모든 것의 과학적 이유를 차근차근 함께 살펴보았습니다. 🌙 밤: 충분한 수면이 모든 것의 시작입니다 (23:00 – 06:00) 우리 뇌는 잘 때 비로소 가장 중요한 업무를 수행합니다. 바로 기억을 정리하고, 뇌의 노폐물(베타-아밀로이드 등)을 배출하는 일이죠. 최소 7시간 이상의 수면은 기억력, 집중력, 창의성을 높이고, 뇌의 독소를 제거하는 ‘뇌 세척’ 작용을 합니다. 자기 전 최소 1시간은 스마트폰 같은 블루라이트를 차단하여, 숙면 호르몬인 멜라토닌 분비를 방해하지 않도록 하는 것이 좋습니다. ✨ 실천 팁: 취침 1시간 전 스마트폰은 멀리 두고, 대신 가벼운 스트레칭이나 명상을 하며 하루를 마무리하세요. 🌅 아침: 뇌를 깨우는 황금 시간 (06:00 – 09:00) 아침 기상 직후 30분은 코르티솔이 급상승하며, 우리 뇌가 가장 빠르고 명료하게 작동하는 시간입니다. 이때 햇빛을 쬐면 뇌의 생체시계가 리셋되고 하루를 긍정적으로 시작할 수 있습니다. 기상 후 바로 햇빛을 받고 가벼운 스트레칭을 하면, 기분이 좋아지고 하루 종일 집중력이 유지됩니다. 간단한 자기계발(독서, 계획 세우기, 명상)을 통해 하루의 방향을 잡아보세요. ✨ 실천 팁: 아침에 일어나자마자 커튼을 열고 창가에서 5분간 햇볕을 쬐며 심호흡해 보세요. 놀라운 효과를 경험할 수 있습니다. 🚀 오전 업무 집중 타임 (09:00 – 12:00) 우리의 뇌는 하루에 두 번 집중력이 최고조에 달하는데, 그중 첫 번째가 오전 시간입니다. 따라서 하루 중 가장 어려운 업무나 창의적인 작업을 이 시간에 배치하면 효율이 높아집니다[^4]. 집중 시간에는 90분 업무 - 10분 휴식 주기를 지켜주세요[^4]. 오전엔 최대한 방해받지 않도록 외부 연락을 차단하는 것이 좋습니다. ✨ 실천 팁: 오전 2~3시간은 메신저 알림을 끄고, 스마트폰도 잠시 멀리 둬보세요. 진짜 몰입을 경험할 수 있을 거예요. 🍽️ 점심 후 에너지 충전 (12:00 – 15:00)

Haebom

2025/04/29 7:30 AM

가르치는 사람도 배워야 한다.

최근 저는 대학교에서 머신러닝 강의를 시작하게 되었습니다. 특강이나 대중 강연 형태로는 익숙하지만, 학부와 석·박사생을 대상으로 하는 15주짜리 정규 강의는 처음이라 더욱 효과적인 교수법을 찾고자 여러 자료를 살펴보고 있습니다. 그 중에서도 특히 인상 깊게 느껴진 세 가지 교수법을 여러분과 공유하고자 합니다. 바로 셰이핑(Shaping), 체이닝(Chaining), 청킹(Chunking)입니다. 두 개의 수업을 하고 있는데 생각보다 가르치면서 배우는 것도 많더라구요. 좋은 기회가 되고 있습니다. 겸임이긴 하지만... 교수 소리 듣는 것도 나름 신기하구요. 1. 셰이핑(Shaping): 전체 흐름을 보여주며 따라 하게 하기 셰이핑은 전체적인 흐름이나 프로세스를 처음부터 끝까지 한 번에 시연하고 학생들이 이를 모방하도록 유도하는 방법입니다. 머신러닝 수업에서도 굉장히 효과적일 수 있죠. 예를 들어, 학생들에게 처음으로 로지스틱 회귀 모델을 가르친다고 할 때, 저는 먼저 전체 워크플로우를 간단한 예제로 직접 시연합니다. 데이터 전처리부터 모델 학습, 평가까지 한눈에 볼 수 있도록 구성하여 학생들이 전체 과정을 직관적으로 이해하도록 돕는 것이죠. 이후 학생들이 같은 프로세스를 스스로 수행하게 하고, 그 과정에서 발생하는 문제에 대해 즉각적으로 피드백을 제공하면 더욱 효과적입니다. 2. 체이닝(Chaining): 복잡한 과정을 단계적으로 연결하기 체이닝은 복잡한 작업을 여러 작은 단계로 나누고 각 단계별로 명확히 학습한 후, 점진적으로 전체 과정을 연결하는 방법입니다. 이는 머신러닝처럼 복잡한 프로세스가 많은 분야에서 특히 효과적이죠. 가령 신경망 모델 구축을 예로 들면, 데이터 전처리, 모델 설계, 학습 및 평가 단계를 각각 별개로 가르친 후, 학생들이 이 개별 단계를 잘 이해하게 되면 전체적인 프로세스를 하나의 완성된 파이프라인으로 연결시킵니다. 특히, 최종 평가 결과를 먼저 보여주고 "이 결과가 나오기까지 어떤 단계들이 있었는지" 역순으로 접근하는 역방향 체이닝 방식을 활용하면, 학생들의 학습 동기와 이해도를 더욱 높일 수 있습니다. 3. 청킹(Chunking): 복잡한 개념을 작게 나누어 배우기 청킹은 복잡한 작업이나 개념을 작고 관리 가능한 단위로 나누어 개별적으로 학습한 후, 이를 다시 결합해 전체를 완성하는 방식입니다. 머신러닝에서도 매우 유용하게 적용할 수 있죠. 예를 들어 서포트 벡터 머신(SVM)을 가르칠 때, 저는 개념 설명, 커널의 의미와 기능, 실제 코드 구현과 같은 세부적인 요소들을 각각의 "청크"로 나누어 개별적으로 다룬 후, 학생들이 이 청크들을 충분히 이해하면 전체 모델 구축을 시도하게 합니다. 이렇게 하면 학생들이 복잡한 내용을 부담스럽지 않게 받아들일 수 있고, 각 단계별로 명확한 이해와 실습 능력을 키울 수 있게 됩니다. 그리고 교수직을 해보면서 느끼는 건데 생각보다 학교 측에서 교수를 대상으로 하는 교육이나 복지 더 나아가 역량 강화 프로그램이 많더라구요. 대부분 무료이고 퀄리티도 높아서 좋은 것 같습니다. 물론 지금 제가 적이 있는 학교가 국민대, 고려대 뿐이라 다른 대학은 어떤지 모르겠으나 생각보다 학생일때와는 또 완전 다른 느낌의 교원 분들을 접하게 되어 신기했습니다. 벌써 중간고사 기간이 끝났고 이제는 기말 입니다. 이번에 알게 되었는데 시험기간은 학생 뿐 아니라 교수도 힘들더라구요... 학부때 너무 교수님들 미워하지 말껄 그랬습니다.

Haebom

2025/04/27 10:50 PM

삼성은 왜 Llama 4를 골랐을까?

최근 삼성전자 반도체 부문(DS)이 메타의 최신 대규모언어모델(LLM) LLaMA4를 전 조직에 전격 도입했다는 기사를 보았습니다. 개인적으로는 왜, 굳이 성능 논란과 벤치마크 조작 의혹까지 불거진 LLaMA4를 선택했을까요? 삼성전자 DS의 선택과 그 배경 삼성전자가 도입한 LLaMA4는 Scout(경량 모델)와 Maverick(기본 모델)으로 구성된 멀티모달 AI입니다. 문서뿐만 아니라 이미지·음성·영상까지 한 번에 처리할 수 있는 뛰어난 모델로 알려져 있습니다. 게다가 무려 10M 토큰이라는 압도적인 컨텍스트 길이를 제공하기 때문에, 반도체 공정 데이터와 같이 대규모 데이터를 다루는 삼성 입장에서는 큰 매력을 느낀 듯합니다. 그러나 실제로 이 선택이 최선이었는지는 의문이 남습니다. 몇 가지 현실적인 이유를 살펴보면 다소 아쉬운 점들이 보입니다. 성능과 벤치마크 신뢰성 논란 LLaMA4는 출시 직후부터 성능에 대한 여러 논란이 있었습니다. 일부 연구자와 개발자 커뮤니티에서는 LLaMA4가 제출한 벤치마크 모델이 실제 공개된 가중치와 다르다는 의혹이 제기됐습니다. 심지어 내부 직원으로부터 "벤치마크 점수를 끌어올리기 위한 무리한 조정이 있었다"는 폭로까지 나왔습니다. 이러한 논란은 기업이 중요한 업무 데이터를 다룰 때 고려할 수밖에 없는 중대한 이슈입니다. 삼성처럼 공정 최적화 및 신뢰성이 필수인 기업이 선택한 모델로서는, 꽤나 위험 부담이 큰 결정이었다는 느낌을 지울 수 없습니다. 사실 개인적으로는 이번 LLaMA4 도입 자체가 그냥 직원용으로 선택지 중 하나를 만든 것인데 뭔가 언론에서 침소봉대 한게 아닌가 하는 생각이 있습니다. 더 효율적인 대안들: Gemma3 QAT의 존재 사실 시장에는 LLaMA4 외에도 뛰어난 성능과 효율성을 보여주는 대안들이 존재했습니다. 예를 들어 Gemma3 QAT(27B)는 상대적으로 적은 하드웨어 자원으로도 뛰어난 성능을 발휘하는 모델로 평가받습니다. 물론 애초에 QAT 자체가 일반 소비자 레벨의 컴퓨팅 파워에서도 원활하게 돌릴 수 있는 LLM 인 것을 감안해도... 뭔가 메버릭을 돈 내고 쓰기엔 아쉬워 보이는게 사실이죠. 삼성정도 되는 기업이면 커뮤니티판을 쓸 것도 아니고 유료 모델을 쓸 것 같고요.(결국.. 그돈씨) 항목 Llama 4 Scout (109 B/17 B 활성) Gemma 3 27B QAT 멀티모달 텍스트·이미지·음성·영상 동시 처리 텍스트·이미지 (음성 X) 컨텍스트 길이 10 M tokens (Maverick 1 M) 128 K tokens 추론 속도 120 tps (FP8, H100 1장) 20-25 tps (INT4, RTX A5000)

Haebom

2025/04/27 10:22 PM

해봄의 아카이브

주요 구성 요소 설명

주요 개념

언어(Language) 밀도: 단어들은 어디에 모여 있는가?

쉽게 이해하기