Haebomのアーカイブ

IT、経済、人文科学について語ります。
ステープルコインはどのようにデジタル金本位制になりましたか?
2025年7月、暗号通貨の歴史の1ページを書き換える法案が米国上院を通過しました。まさにジニアス法です。見た目には単純な規制法案のように見えますが、事実上現代の「デジタル金本位制」と呼ばれるステープルコインの本質を一気に振ることができる転換点と考えられます。 1971年、ニクソン大統領が金本位制を廃止した後、ドルはもはや金と連結されずに自ら基軸通貨として位置づけられ、私たち全員は「ドルがまもなく金」である時代を生きることになりました。ところが2025年現在、私はこの流れが再び逆に行っていると思いました。今回はデジタル資産がドルを置き換える方向です。ステープルコインがまさにその役割をしています。 それでは、なぜこの時点で米国はステープルコインに強い規制​​を試みるのでしょうか?私はこの質問の答えを見つけるために最初にステープルコインの性格をもう一度見なければならないと思いました。 2025年基準で、世界中のM2通貨量は55.48兆ドルに達し、歴代最高値を記録しました。このように膨大な流動性は自然にインフレの懸念を生み出し、実際にドル指数(DXY)は2025年上半期だけで10.8%も下落しました。この中で暗号通貨市場はあふれるドルを吸収する「デジタルブラックホール」のような役割をしていました。 テザー(USDT)の時価総額は1,430億ドルを突破し、USDCも580億ドル規模です。これはすでにグローバル決済インフラの一部であるという認識が必要だということです。 デジタルトリピンジレンマ:ステープルコインの矛盾 ステープルコインを取り巻く状況を見ながら自然に浮かんだ概念が一つあります。まさに「トリフィン・ジレンマ」です。私がこの概念を初めて聞いたのは約2017年ごろでしたが、当時は「ちょっと古い理論ではないか」という考えもしました。ところが、デジタル資産が本格的にドルを吸い始め、再びこの概念が有効に感じられました。 1960年代の経済学者ロベル・トリピンは、基軸通貨国が直面する構造的矛盾を指摘しました。ドルは世界中に供給されるべきですが、同時に信頼性と制御力を維持しなければならないという両立不可能な条件です。今のステープルコインはこのジレンマのデジタル版と見なすことができます。流動性供給のために大規模な発行が必要ですが、米国の立場ではドルの主権を失っているわけですから。 BISによると、米国外地域でステープルコインを通じて流通する「影ドル」規模は、なんと13.2兆ドルに達しています。米国の直接統制が届かない領域でドルが別途流通しているという意味でしょう。 GENIUS Actの重要な規定と隠された意図 一見、消費者保護と市場健全化のように見えますが、私はこの法案の核心がドル統制力回復にあると考えました。主な規定を見ると、その意図がより明確に明らかになります。 米国の管轄内のステープルコイン発行会社を銀行および国家許可機関に制限 発行されたステープルコインは1:1ドルの預金で保証 外国発行ステープルコインに対する技術的制御権限の確保(凍結、焼却、遮断) 結局、これは「デジタル蛇口」を作り、世界中のステープルコインの流れを掌握するという試みだと見られます。 現実的なシナリオ:デジタルニクソンショックの可能性 この法案が現実化するにつれて、私は「もしアメリカが本当にステープルコインの蛇口をロックしてしまったらどうなるのだろうか?」という想像をしてみました。技術的にすでに主要なステープルコイン発行会社は凍結と焼却機能を持っています。 そうなるとビットコイン、イーサリアムはもちろん、全体の暗号通貨市場が流動性萎縮で大きな衝撃を受けるだろう。ところがアメリカの立場では、この混乱が一種の機会になることもあるでしょう。 1971年にニクソン大統領が金胎環制を中断してドル中心秩序を構築したように、デジタル時代にも通貨覇権を再確立しようとする試みで見ることができますから。 私がこのような話に初めて触れたのは2017~2018年頃でしたが、その時はICO狂風直後であり、USDの準備金疑惑も真っ最中でした。 ステープルコインは単純な中間媒介ではなくグローバル流動性リポジトリに進化した 各国中央銀行のCBDC開発が本格化し、デジタル通貨覇権競争が始まった。
  • Haebom
中国のスーパーアプリ(Super App)はなぜ成功したのか?
最近、串コーチングを通じて中国語に堪能な方に会いました。それから中国でよく使われるアプリについて話し、私が使ったことがあることを話しました。中国をよく知らない方でもウィチャット(WeChat)は一度聞いてみたはずです。中国ではウィチャットなしではほとんど何もできないという冗談もあります。 食事の注文、タクシー通話、ショッピング、決済はもちろん、さらに政府サービスまでウィチャンの中で解決が可能です。韓国でよく使われるカカオトークやネイバーと比べても、はるかに多様な機能を一つのアプリの中で提供します。中国のこのような「スーパーアプリ」現象は、単に中国人がより便利なものが好きなのでしょうか?それとも別の理由があるのでしょうか? 多くの場合、東西洋のアプリデザインの違いを説明するとき、「アジア人は情報が多く複雑なアプリが好きで、西洋人はシンプルなアプリを好む」と言います。しかし、実際にはそうではありません。最近、中国や韓国、日本などアジア諸国のアプリも徐々に、よりきれいでシンプルなデザインに変化しています。それにもかかわらず、なぜスーパーアプリは中国で唯一の強力な位置になったのですか? スマートフォンで始まった「モバイル優先」時代の出発点 2010年代初頭の中国は、インターネットがまだ正しく解決されていませんでした。当時、中国のインターネット普及率は35%未満で、デスクトップコンピュータを使っている人も多くいませんでした。このような状況で、中国の消費者にとってスマートフォンが最初の個人用コンピューティング機器になったのです。 このようにモバイル中心のインターネット環境が最初から構築され、既存のインターネット習慣は形成されていません。例えば、米国とヨーロッパの場合、すでにウェブブラウザやメールなどデスクトップベースのインターネット使用習慣が定着していたが、中国は最初からモバイルアプリが主流でした。この隙間を埋めたのが、テンセントのウィチャットです。 WeChatはメッセンジャーで始まりましたが、「公式アカウント(Official Accounts)」と「ミニプログラム(Mini Programs)」を通じてほぼすべてのインターネットサービスを提供し始めました。 事実上、ウィチャットは中国のグーグルクロム(Chrome)のようなブラウザの役割を果たしたわけです。既存のWebベースのサービスをモバイルに移行することなく、最初からアプリ中心の環境を作成しました。ここで私はいつも話しているテンセントマファタング会長の言葉を思い出します。マファタングはテンセントのQQとゲームがコピーキャットと呼ばれていたときにこう言いました。 「私たちは猫を見て虎を描いた」 初期の中国のデジタル経済は、インフラが非常に不足していた。銀行は消費者に優しいオンライン決済システムを提供しておらず、買い物は現金取引の中心であり、Eコマースは信頼できない初期段階でした。この状況で、アリババはタオバオのオンライン取引のためにアリペイを開発して独自の決済システムを構築しました。 企業は必要なサービスがなければ自分で作り上げなければなりませんでした。これがスーパーアプリが誕生した本当の理由です。つまり、理想的なユーザーエクスペリエンス(UX)のためではなく、市場の空白を埋めて産業全体を素早く占めるための必然的な選択でした。 「フェンスを積む」競争戦略の登場 中国のスーパーアプリの成長は、別の理由で説明することができます。まさに極端な競争環境のためです。テンセント、アリババ、バイドゥ(Baidu)、バイトダンス(ByteDance)などの巨大企業は、長い間お互いのプラットフォームリンクをブロックする、いわゆる「ウォールガード」戦略を使用してきました。ウィチャットでタオバオのショッピングリンクを開こうとすると接続にならない式でしたね。そのため、各企業は独自のアプリにできるだけ多くのサービスを追加しようとしました。 これにより、WeChatのようなスーパーアプリは、食品配達、タクシー通話、支払い、ショッピング、ソーシャルメディアまで、すべて1つのアプリの中で提供するようになりました。 もう一つの理由は、経済的観点から見ることができます。初期の中国の消費者のオンライン消費力は西欧に比べて低かったので、個々のアプリ1つにつき得られる顧客の生活価値(Lifetime Value)は少なくなりました。これにより、企業は顧客に可能な限り多くのサービスを提供することで顧客あたりの収益を最大化しようとしました。 また、初期の顧客獲得コストが非常に高かったため、アプリを1人に集めれば、そのユーザーを競合他社に送らないように、より多くのサービスを統合しました。テンセントがウィチャット・ペイ(WeChat Pay)を宣伝するために、中国の旧正月春節(CNY)に「赤い封筒(ホンバオ)」キャンペーンを行って現金を配ったのもこのような戦略の一環でした。 文化的好みではなく戦略的選択 スーパーアプリが中国で成功した理由は、ユーザーのニーズによるものではなく、モバイル優先環境、産業インフラの不足、激しい競争環境、低消費電力などのユニークな市場条件が組み合わされたためです。 それでは、他の国の企業がスーパーアプリモデルにそのまま従うべきでしょうか?必ずしもそうではありません。むしろ重要な教訓は、製品設計の決定が何によってなされているかを理解することです。スーパーアプリはいつも正解ではありません。場合によっては、1つのアプリにさまざまなサービスをまとめるのが良いかもしれませんが、他のケースでは、最高のユーザーエクスペリエンスを提供する単一のアプリを作成する方が効果的かもしれません。 実際には、すべてのことを解決できる「完璧なスーパーアプリ」ではありません。誰がいますか? 個人的に本当のスーパーアプリを成し遂げたのはトスくらいです。 中国のスーパーアプリケースで私たちが得ることができる最大のTakeawaysは、ビジネスニーズが製品をどのように進化させたかを理解することです。結局、製品の成長はユーザーのニーズではなく、企業が直面する環境と市場条件の戦略的対応から始まるからです。 個人的に中国のデジタル生態系や技術力を最も過小評価するところが韓国だと思います。私がいつも言うように、中国の先進市でなければ上海などだけ行ってみても私が知っていた中国ではないと思うんです。
  • Haebom
👍
1
ブラックボックスを超えて:金融圏AIの説明可能性を実質的に実装する方法
最近、金融関連サービスを作るところに人工知能企画、アーキテクチャ諮問をしながら、金融業でもこのような議論が加速されていることを感じました。 ChatGPTのような生成型AIが大きな注目を集めていますが、それよりはるかに以前から金融圏では人工知能(AI)を積極的に活用してきました。詐欺検知から信用リスク管理、さらには超短打取引戦略まで、金融の中核業務のあちこちでAIが重要な役割を果たしています。しかし、人工知能が実際に信頼され倫理的に使用されるためには、まだ多くの宿題が残っています。その中で最も重要な問題がまさに説明可能性(Explicability)です。 金融圏でAIモデルが複雑になるほど、それがどのように意思決定を下すのかを把握することは難しくなります。よく言われる「ブラックボックス」問題です。 AIモデルが正確な予測を出すとしても、その予測がどの基準とプロセスに基づいて行われたかを説明できない場合、特に金融のような信頼が不可欠な分野では深刻な問題になる可能性があります。だから今日はこの「説明可能性」とは何であり、金融​​圏で実際にどのように実装できるかについて深く見てみたいと思います。 しばらく興味深い例を挙げましょうか? 2019年、Apple Card(Apple Card)は性差別的ローン審査の議論で社会的問題になりました。同じ所得と信用度を持った夫婦が申請したが、夫の信用限度が妻より格段に高く策定されたのです。人々はすぐにこの決定が「性別による差別」であると批判しました。しかし、カードカード発行会社と審査アルゴリズムを管理していた金融機関は、この問題が発生した理由を正確に説明できませんでした。その結果、深刻なイメージ打撃を受けました。 このケースは、金融圏でAIが機能するときに発生する可能性がある問題をよく示しています。AIはデータに基づいて意思決定を下します。 この文脈で、金融圏ではAIを使用する際には、次のような質問をしなければなりません。 「私たちのAIモデルはなぜそのような決定を下したのか」 「AIが下した決定は果たして公正なのか?」 「AIモデルの判断基準を私たちが説明できるか?」 AI説明の可能性を実現する3つの重要な要素 説明可能性は、単にモデルがどのように機能するかを技術的に示す以上のものです。金融圏でAIの説明可能性を正しく実現するためには、次の3つの要素をすべて備えなければなりません。 (1) 透明性(Transparency) AIモデルがどのように構成されているのか、どのデータで訓練されたのか、どの前提条件や仮定に基づいて機能するのかを利害関係者に明確に開示することです。 たとえば、信用評価モデルのデータソースと評価変数の選択理由を顧客と規制当局に開示することで信頼を得ることができます。 (2) 解析可能性(Interpretability) AIの決定を人間が容易に理解できるようにすることです。モデルがどのように機能するかは、単純なアルゴリズムまたはビジュアルツールで説明できるはずです。 たとえば、ローン申請を拒否した理由を特定のデータポイントとして説明できるはずです。 (「あなたのクレジットカードの使用率が高く、融資が拒否されました」など) (3) 責任性(Accountability) AIモデルが下した決定に対して明確な責任素材を定め、問題が発生したときにどのように対応するか事前に定めることです。 モデルが誤った決定を下したとき、それを直ちに修正し、被害を救うことができる明確なプロセスと責任者を設定するのです。 これら3つの要素すべてを統合する統合的なアプローチが、金融圏でAIの説明の可能性を適切に実装するための鍵と言えるでしょう。
  • Haebom
👍
2
AIは医師より4倍正確ですか?
病院を見つけるとき、私たちは常に正確な診断と迅速な治療を期待しています。しかし、現実は長い待ち時間と医師の人員不足のために望むときに治療を受けにくいです。ところが最近、Microsoft(Microsoft)が公開した驚くべき研究が医療界に新たな可能性を提示しました。まさに人工知能(AI)を活用した診断システムが、人間の医師より4倍も正確な診断を下したということです。 「AIは本当に医者に代わることができますか?」という疑問があるのも事実です。 AI診断オーケストレーター、医療界に登場する マイクロソフトが発表した「 AI診断オーケストレータ(Microsoft AI Diagnostic Orchestrator、MAI-DxO) 」は、単なる人工知能モデルではありません。このシステムは、異なる役割を果たした5人の医師が集まったパネルのように設計されています。各AIエージェントが仮説を立て、検査項目を選択し、最終診断を下すために互いに意見を交わし、最も適切な治療方法を導き出す方法です。 ここで興味深いのは、AIが結論に達するプロセスを明確に示すことです。マイクロソフトはこれを「チェーン・オブ・ディベート(Chain of Debate)」と呼び、AIがどのような論理を通じて問題を解決したかを透明に公開しました。 人間の医者を超える精度? それでは、このAIは実際の医療現場でどのように効果的ですか?これを検証するために、マイクロソフトは米国最高医学ジャーナルであるNEJM(New England Journal of Medicine)に掲載された最も厳しい診断事例304件をAIに提示しました。 結果は驚きました。 AIが最もうまく機能した場合(OpenAIのo3モデルを使用)の診断精度はなんと85.5%でした。同じ事例を診断した経験豊富な人間医師の成功率はわずか20%でした。人間の医者が教科書や同僚の助けを受けられなかったという限界がありましたが、それでもAIの圧倒的な成果は医療界の大きな衝撃で迫ってきました。 コストと時間を節約するAI 正確さだけでなくコスト削減効果も注目を集めました。マイクロソフトは、AIが診断プロセス中にコストを考慮するように設定し、これにより必要な検査数が大幅に減少し、実際のケースでは数十万ドルのコストを節約できたという。 「このシステムは、私たちが見た中で最も優れたAI性能を示し、医療アクセシビリティの新しいドアを開くことができます」マイクロソフトのドミニク・キング博士はこう評価しました。 AIモデルは今「商品」、本物の競争力は「組み合わせ力」 この実験では、MicrosoftはOpenAIだけでなく、メタ(Meta)、アントロピック(Anthropic)、Google(Google)、xAIなど、さまざまな企業のAIモデルを活用しました。特に最高性能を見せたOpenAIのモデルも最終的には「商品化(commodity)」されるだろうし、真の差別性はこれらのモデルを統合して組み合わせる「オーケストレーター」にあるとムスタファ・スレイマン(Mustafa Suleyman)は強調しました。 マイクロソフトは、この技術を自社のAIチャットボットのCopilotとBingの検索エンジンにも適用する計画だと明らかにしました。これは、1日5000万件を超える健康関連の質問を処理するプラットフォームで大きな可能性を発揮することが期待されています。 「医療超知能」時代、準備が必要 ムスタファ・スレイマンは今回の研究を「医療超知能(Medical Superintelligence)」に向けた第一歩と表現します。より速く、正確で安価な診断が可能な未来が鼻先に迫ってきたのです。しかし、まだ臨床環境に導入するには追加の検証が必要です。心臓専門医であり、AI医療の権威であるエリック・トポル博士もこの研究が実際の医療環境で行われたわけではありませんが、AIが持つ医療効率の可能性を立証した重要な研究だと評価しました。
  • Haebom
Z世代の性的不況を理解する
「最近、若者はあまりにもセックスをしません。信じられないほどです。」 2016年、アメリカのメディア「Bustle」は、20代前半の若者の間で性関係の頻度が急減したという衝撃的な研究結果を紹介し、こう宣言しました。以後、この現象は「セックス不況(Sex Recession)」という名で呼ばれ、大きな話題を集めました。アメリカの「アトランティック」の表紙に登場した蜂と鳥がお互い背を向けている絵は、この世代の性的断絶を強烈に表現しました。 過去の大人たちが心配したのは「あまりにも乱雑な若者たち」でしたが、今日の既成世代はむしろ「セックスを忌避する若者たち」を懸念しています。 18~24歳の男性のうち、約3分の1と女性の5分の1が一年以上性関係をしていないことが分かり、ファンデミックはこの現象をさらに深化させました。 すべてが可能ですが、何も望まない世代 興味深いことに、Z世代は以前の世代よりも城に対してよりオープンで多様な選択肢を持つ世代です。スマートフォン一つなら簡単にデートアプリを通じて短く軽い出会いを持つことができ、様々な性的好みが自由に収容される時代を生きていきます。しかし、なぜ彼らは城を離れるのですか? これに対して、イギリスのジャーナリスト、ルイス・ペリー(Louise Perry)は、やや保守的だが興味深い視点を提示します。彼女の本『21世紀の城ガイド』では、性を真剣に受け入れ、男女間の生物学的違いを認め、カジュアルな性交の危険を警告します。フェリーは、「すべての男性は素手でほとんどすべての女性を殺すことができる」という強烈な警告とともに、女性はセックスパートナーを慎重に選択する必要があると主張しています。 一方、ガーディアン(Guardian)の記者カーター・シャーマン(Carter Sherman)は、自身の本『第2革命(The Second Coming)』で、Z世代が性的不況を経験する理由を、政治的保守主義とインターネットという巨大な力の間に挟まった結果として説明します。阻害の結果をもたらしたということですね。 性的不況の本当の理由は「関係」の不況です 性的不況の根本的な問題は、まさに「孤独」です。関係を結ぶのに苦労しています。 ソーシャルメディアの影響で、自分の魅力を数値化された基準で絶えず評価される環境も親密感形成に障害物となります。結局のところ、性的不況は、関係を築くことの難しさと他人との本当のつながりが希薄になった社会的現象を反映することです。 私たちは何をすべきですか? ルイス・フェリーとカーター・シャーマンの両方がそれぞれの観点から性的不況の原因となっていますが、最終的に両方の著者が見落としたのは、まさに姓の「喜びとつながりの力」です。城は単に物理的な喜びだけを提供するのではなく、人間が他人と最も深く直接接続することができる貴重な領域です。親密な関係の中で、私たちはお互いを理解し、尊重し、愛する方法を学びます。私たちの社会は、Z世代が再び城を通して健康な人間関係と楽しい経験を生み出すのを助けるための議論が必要です。性的不況の根本原因を単に個人の問題に縮小させるのではなく、より包括的で深い社会的対話を始める時です。 最近このような記事を見て実際にZ世代が望むのは「単純な出会い」ではなく相手を理解して知っていく過程のようなのですが、それが自慢チュウと呼ぶ領域なのか…それとも以前に流行していたResume紹介ティングのようなものかはよくわかりません。
  • Haebom
バイブコーディングシャベル EP.02(feat.収益化)
最近、私が投稿したバイブコーディングに関する記事は、思ったよりも多くの興味を持っています。特に具体的な収益物語を正直に共有したところ、多くの方々が共感して興味深く見ていただきました。おかげで気持ちよく過ごしていましたが、しばらく前に意外な状況に直面しました。 まさに匿名の誰かが私が運営する海外法人に関して申告をしたことです。 最初は本当に驚きました。私が違法なことをしたわけでもありませんが、何もせずに申告が入ってくるから皇后だったんですよ。今回の経験を通じて、私のように海外法人やグローバル決済をお悩みの方に有用な法的な話を分かち合おうと思います。 🚨どのような報告でしたか? 届出の内容はこんな感じです。私がStripe Atlasで設立した海外法人に対して、国内で必要な各種届出や手続きをきちんと履行しているかどうかの苦情でした。 結論から申し上げると、私は幸いなことに問題はありませんでした。なぜなら私は最初から専門税務士を通じて税金申告(総合所得税)と外国為替取引申告などを確実に処理していたんです。ちょうど鐘の税シーズンでもあり、税務士様と書類の準備を慎重にしていた中でした。利村税務会計法人はいつもありがとうございます。 韓国で海外法人を運営する際に必ず知っておくべきこと ところで、今回のことを経験して知り合った事実があります。意図せず私の場合はすでに準備ができていましたが、もしあらかじめ適切に準備をしていなければ複雑で面倒な状況が生じる可能性があります。韓国で海外法人を設立または運営する際に必ずしなければならない義務があります。詳細は事実私もよく分からないので税務士様のアドバイスと指示に従いました。 外国為替取引申告(外国為替銀行を通じて海外直接投資申告及び定期報告必須) 総合所得税申告(国内で発生した所得のほか、海外で発生した所得も含めて処理) 上記の手順は難しくありませんが、あらかじめ設定しないでください。 個人的に役立つヒント 私が今回問題なく乗り越えられたのは、次の理由のおかげです。 1️⃣専門税務士の助けを借りて 個人事業者でも法人でも税務士と一緒にすれば、このような状況にもすぐに対処できます。 (特に総合所得税申告シーズンには税務士様が本当に心強いです。) 2️⃣クリエイター自動入金サービス(新韓銀行)を使う 開発者やクリエイターなら収益管理が複雑になることがありますが、私は新韓銀行の「クリエイター自動入金サービス」を使っていて収益管理がきれいにまとめられていました。これのおかげで報告するのに便利でした。 3️⃣海外法人が必ずしも必要でない場合は、国内ソリューションを利用する 実際、海外法人が必ず必要な状況でなければ、国内で楽に決済システムを構築できるソリューションが多いです。個人的には、ラピッド(Latpeed)やトスフェイメンツなどのサービスが一番現実的でおすすめです。 個人事業者、複雑なのが嫌ならレピードをお勧めし、直接開発ハンドリング可能で法人事業者のような場合にはトスおすすめです。もちろん、海外法人の設立や取扱いが可能な場合は、Stripe AtlasやLemonSqueezeをお勧めします。 海外法人、ぜひ必要ですか? 「本当に特別な理由がなければ、海外法人は不必要に複雑になる可能性がある」
  • Haebom
6
👍
6
バイブコーディング奮闘記 EP.01
最近投稿したバイブコーディングに関する記事は、予想以上に大きな関心を集めました。多くの方々が成功談にのみ注目しましたが、実際にこの過程で経験した様々な試行錯誤と失敗事例もあります。本日はその中から、私が経験した興味深い「試行錯誤の記録」の一つを皆様と共有しようと思います。 私が当時開発したサービスは、「PDF AI SHIELD」という名前のPDF保護システムでした。最近広がるLLM(大規模言語モデル)がPDF文書を簡単に読み込んで要約してしまう現象が増え、それを防ぐための方法として考えたアイデアでした。大学で学生たちに資料を配ったり、公文書などを一生懸命作成して共有した際、そのすべてをAIで要約されて読まれてしまうので、これをどうやって制限するかを考えました。 LLMが私たちが提供するさまざまな文書やデータを整理し要約する方法は簡単です。LLMは文書を読み、重要なポイントを見つけ、結びつけ、短くまとめて出力するというプロセスを通じて情報を私たちに提供します。 この過程で、私は「読み取り」段階に介入し、LLMがそもそもチャンクを行えないように妨害する方法を考案しました。一般的なPDFセキュリティはパスワードや証明書、OCR削除などの方法を使用しますが、私はこれに特別な方法を追加しました。 その方法がまさに「見えないペイント」をPDFに施すことでした。人から見ると全く異常はありませんが、LLMの目にはそれを読めないように妨害する一種の「透明ペイント」を文書に追加したのです。 さらに、証明書形式のタグやPDFメタデータを暗号化して、LLMが簡単に読み取れないようにしました。技術的には予想以上にうまく機能しました。ChatGPTやClaudeなどの有名なLLMを含め、ローカルのLLMモデルまでこの方法で阻止できました。初めて結果を見たとき、大手AI企業に対して小さな勝利を収めたような気さえしました。 この自信をもとに価格方針を決め、Redditやいくつかの海外コミュニティでのプロモーションも進めました。予想以上に早く購入者が現れ、すぐに成功したビジネスとして定着しそうでした。正直、この時点で少し浮かれていたことも事実です。 ビジネスモデルは以下のように構成されています。 非ログイン状態では最初の1回無料で使用 ログインすると、1日1回使用が可能(24時間基準) 月間購読では1日最大30回使用可能 年間購読の場合は無制限で利用可能 しかし、しばらくして予期せぬ問題が発生しました。GPT-4o、Claude Sonnet 3.5、Gemini Proのようなモデルではうまく機能していましたが、最新モデルのo3やSonnet 3.7ではこの保護技術が完全に無力化されました。さらに、miniモデルや特定の条件下では、メタデータの暗号化すら突破されるケースが出てきました。 幸い、初期ユーザーの一人が親切にこの問題を報告してくれました。そのため、私はすぐにすべての購入者に対して返金を行いました。セキュリティというサービスの性質上、一度でも突破されれば製品を売り続けることはできなかったからです。当初得た収益は決済手数料などでむしろ赤字になりましたが、迅速な対応のおかげでより大きな損失を防ぐことができました。これでセキュリティ関連の訴訟を受けるよりははるかにいいですからね?そもそも入金が完了したものを収益と言ったわけではない このような体験談をいくつか持っています。反応が良ければ、今後さらに多様な話を共有してみようと思います。実はバイブコーディングの最初の記事でも述べましたが、バイブコーディングを進めると、自分が思っている以上に多くの試行錯誤や修正が必要で、その過程で開発者の需要がさらに増えると考えています。そして、こうした試行錯誤が繰り返されることでより良い製品になるように感じますね。 人々は失敗談よりも成功談や劇的な話を好むようですが、個人的にはこのような失敗談もかなり多いです。「試行錯誤」と表現しましたが、個人的に学んだことも多いです。このような文章がどの程度反応を得るかはわかりませんが、一度良い反応が得られれば、第2編、第3編も引き続き共有していこうと思います。
  • Haebom
3
👍❤️
29
コーチングで100人以上の人に会った簡単なレビュー
会社を辞めて創業を始めながら、最も大きく感じたのは良い刺激への憧れでした。感謝して、多くの方々の助けと時代の流れのおかげでご飯飢餓の心配はなく、会社は思ったより速く安定した軌道に上がりました。しかし、良い仲間との着実な交流への渇きは容易に満たされていません。一人の事業者として、いくつかのフリーランサーの方々と遠隔勤務の形でコラボレーションしてみると、自然に会社の仲間のように快適に話し合い、お互いに刺激をやりとりする関係が懐かしくなりました。 大切な人材をただこのような理由で採用するには負担にもなり、たまに他の企業で週1回働いてみたこともありましたが、期待していた刺激やインスピレーションとは少し距離がありました。特定の読書会を主催または参加してみましたが、やはり何か不足していました。幼い頃はいろんな人と贅沢に集まるのが好きでしたが、今はそんな席からくる疲れ感も大きかったです。 そんな中コーチングを思い出すようになりました。以前にアジャイルコーチ教育を受けながら学んだ技術とプログラムがあったので、これをもとに無料でコーチングを進めてみることに心配しました。最初は対象者を特定せず、主に低年次サラリーマンや就コン生を対象に始めました。時間が流れ、驚くべきことに50代、60代の方々も訪ねていただきました。人生の2幕を準備したり、すでに元気に走っている方々でした。 一度は小型船を作る方と会って話を交わしました。彼は巨済で20トン未満の小型船舶を専門に製作する造船所を運営しておられました。アルミと名前も難しい繊維強化プラスチックを組み合わせたハイブリッド船舶を作り、船主の細かい要求に応じて船の上部構造物をオーダーメイドで製作する方式が非常に印象的でした。私はそれまで釜山、仁川、江陵を旅行して数え切れないほどの船を見ましたが、船を誰がどのように作るかについては考えたことがありませんでした。このように、小さな造船所が大きな造船所とは違った方法で柔軟に顧客に合わせた製作をするという事実を知ることができたので、新しい世界を垣間見た気分でした。そしてここで何らかの手数料を受けて、各費用がおおよそどれくらいかかるのかもすごく面白い素材でした。 ある日は現職の看護師の方々と話をしながら「マイデューティ」というアプリを知りました。マイデューティは、看護師が自分の複雑な交代勤務スケジュールを効率的に管理し、仲間と簡単に共有できるようにするツールでした。このアプリの最大の利点は、同じ病棟内の同僚の勤務表を一目で見ることができるということでした。 IT業界で働きながらも全く知らなかったサービスであり、特定の職業群のニーズを正確に把握して誕生したこのアプリは私に大きなインスピレーションを与えました。グローバルも進出してたくさん使って今はいけないアプリになったんですよ。 いつはマンドで働いている二分を通じて、自動車一台が作られるためにどれほど複雑で精密な協力構造が必要かを学びました。マンドは、自動車のブレーキ、ステアリング、サスペンションなど、ドライバーの安全性に直結する重要な部品を開発して製造する企業です。私たちが毎日乗っている一台の自動車にも、こういう数多くの部品や企業が細かく編まれているという事実は、通常一つの製品を全体的に作るように働いてきたIT分野の私にとってはとても新鮮な刺激でした。個々の部品を専門的に製作し、各企業が有機的にコラボレーションして最終製品を完成する製造業のやり方は、私が普段経験したコラボレーションの形と全く違う魅力を見せました。もちろん、頭ではそのように作られていることを知っていましたが、実際にその仕事をして産業に従事する方の話を直接聞くので、一層変わったこともあります。 このように串コーチングを通じて数多くの分野の方々に出会いながら、私が見る世界がますます広がり深くなることを感じました。ただ人々に会ったのではなく、多様な人生と経験を通じて世界を理解する視野が広がった感じでした。時には出会った人同士がつながって採用が行われたり、事業的なコラボレーションが始まったりもしました。思いもよらないところで意外なインスピレーションを受けた時は、それ自体で私にとって大きな喜びでした。 多くの人との会話は、最終的に一つのことを実現させました。私が知っていると思った世界はあまりにも狭く、私たちがお互いの話を交わすと、初めて広くて多彩な世界が見えるという事実です。今後も私は串コーチングを通じてより多くの人と出会い、より多くの話をまとめ、お互いの生活をより意味のあるようにつなげたいと思います。一人、一人お会いすると、累積ではなく、個人で100分を超えて会うことになり、これは膨大な資産になりましたね。ご飯の値段とコーヒーの値段がたくさん聞きましたが、それ以上の価値を持っていたと思います。今後はより体系的に会ってみるといいと思ってこれだけ減らします。
  • Haebom
👍🥰
12
人間は正義をどのように確信できますか?
先週末、裁判官を務め、様々な事件や事例を経験した裁判官夫婦のお宅に行き、楽しい時間を過ごしました。二人はみんな裁判官の法峰を下ろし、今は弁護士と全員生活をしておられるのに、夜が深くなり、焚き火を吸いながら様々な話をして、私の好奇心で「裁判官は共鳴正大なのか?」に対する発則な質問から始めて、どのようにそれを訓練し、確信できるかについての話になりました。 以後、きっとこの考えをまとめてみていますが、もちろん私は法律家はどこか市民として最小限の法知識だけがあるだけです。 世界中で発生する司法遅延 「遅延定義は定義の欠如(Justice delayed is justice denied)」 この古い格言は今世界中で現実化されています。司法省についてこれを知るより、英国の事例が目立った。欧州から韓国まで司法部が事件の適体と裁判の遅れで虐殺に苦しんでいます。特にイギリスとヨーロッパでは、深刻な裁判遅延事例が続出し、司法システム自体が麻痺する危機に瀕しています。 イギリスの法務省の発表によると、 2016年に約4万8千件に過ぎなかった裁判所事件の適体は、2024年現在7万件以上に増加しました。ロンドンでは、ナイフで脅かされた被告人のわずか3日の裁判日程が2028年に取られた事例が発生し、社会的に大きな波長を生みました。欧州全般的に司法システムの投資が慢性的に不足した状態であり、欧州評議会の調査では、欧州各国の司法予算がGDP比0.31%水準で10年間実質減少したと指摘しました。ポルトガルのリスボンでは、裁判所の従業員の頻繁なストライキで裁判業務が麻痺するケースが頻繁に発生しています。フランス、スペインは言うまでもありません...アメリカも最近、いくつかの虐殺に苦しんでいます。 韓国の司法部も危機を経験しています。最高裁でも政治的問題で注目が集まり、事件の適体が深刻になり、これは結局国民の裁判請求権と権利救済に実質的に被害を与えています。 司法省を人工知能に置き換える? 国会が昨年末、判事を370人増援する法案を通過させたが、単に人員を増やすことで根本的な問題解決は難しいという指摘が多い。むしろ司法システム自体の構造的かつ効率的な改革が必要であるという声が高い。 このような状況で最近、判事の役割を人工知能に置き換えれば、公正な判決が可能だという主張が出ています。しかし、これは大きな錯覚です。人工知能はむしろ従来の偏向性を増幅する可能性が高く、最近のディープラーニングベースの超巨大人工知能モデルは内部の動作原理がブラックボックスのように偏向の原因を追跡することさえ困難です。結局、判決を下す存在の問題は不完全性ではなく、判決の一貫性にあると見なければなりません。 司法省が存在する最も根本的な理由は、明確な原則と哲学の下で一貫した判決を下すことができるように私たちが権限を信頼して任せたからです。ところが最近、民意や多数の意見という名前で判決の哲学と基本論理自体が揺れる事例がしばしば現れています。これは法律社会が徐々に崩壊する始まりかもしれません。 過剰な立法によって引き起こされた司法の混乱 韓国の問題の一つは過剰な立法です。韓国は、1年に制定される法律の数が他の国に比べて圧倒的に多いです。法律が過度に多くなると、解釈の余地が狭くなり、様々な社会的・経済的活動が萎縮します。法律間に矛盾する場合も頻繁に発生し、企業や市民が法を守ること自体が難しくなる逆説的状況が演出されます。 この問題を解決するために必要なのは、むしろ立法府のデジタル化です。人工知能が裁判官を置き換えたり支援したりするのではなく、立法段階で法律間の衝突の有無と社会的影響を十分にデータでレビューするシステムが必要です。現在のように、同じ党や同僚議員の要請に応じて法案を支持する慣行を改善しなければならず、初期にはブラインド評価で法案の内容を客観的に評価し、その後に記名投票で責任性を高める方法も検討してみます。 結局のところ、定義は贅沢ではなく、私たちが必ず守る必要がある不可欠な価値です。司法省の一貫性と独立性を守るための根本的かつ体系的な改革とともに、立法省のデジタル化を通じてより透明で効率的な法律体系を構築することが、今私たちが直面した危機を克服する現実的な道になります。 国 議員当たりの年間平均足の法案数 総年間足の法案数 議員足の割合(%) 政府の足の割合(%) 法案通過率(全体)
  • Haebom
5
👍
6
論文掲載確定:人工知能記憶構造に関する研究
最近、韓国人工知能学会( https://kjai.jams.or.kr/ )誌に論文がAccept(掲載確定)して共有します。 Pre-print形式で以前にArxivにアップロードされていた論文ですが、名前は途方もなくHEMAで建てられました。実は脳の一部である海馬から取った名前です。 脳の海馬は、記憶と学習を捧げる重要な役割を果たす構造です。特に新しい事実を記憶し、空間を探索する上で重要な役割を果たし、扁桃体と相互作用して感情的な記憶を形成することにも関与します。 この論文の中核はLLMでLong-Context だから長い会話をする場合、品質が落ちることを防止する研究です。簡単に話すと、人間がある事件、状況を覚えているとき、すべてを細かく覚えていないかのように一般的に要約して記憶することをCompact Memoryという形でtext形式で保存し、人間の場合、象徴/信号などをメインに記憶することをポイントにとり、事前に分けた会話をVector DBの形で保存してVector Memoryに持っていきます。 このような場合、長い会話でより長く文脈を維持しながら動作が可能で、一貫した経験が可能です。以後、小説、ペットチャットボットなどを運営するのによく使えるようで、完全再現方式で実験を行い、SLMで繰り返し実験を行いました。一応は英語基準で、6b基準でも性能が良くなるのを見れば、すでにサービス化されているClaudeやChatGPTではもっとうまく動作するはずです。 通常はClaudeのようなものを使用するときに会話が長すぎて他の会話に移動しなければならないか、ChatGPTでも会話が長くなるとパフォーマンスが低下する場合がありましたが、最近はこれをProject機能やMemory機能などで解決したいと思われます。以前までは、プロンプトを通じて「以前まで会話を要約整理してくれ」と同じ方法で一度整理させ、新しい話を始めたのと似ています。 KCI、SCIに論文をずっと出していますが、ハードルが高くなったように感じられます。打率が以前と同じではありませんね。最も煩わしいのは、会社にいたときは会社資源で研究を豊かに(?)させることができたら、今はギリギリ慈悲にしなければならないという点があります。その後の研究を通じて文体を維持し、重複した内容がなく、均質に結果物を出すことについて一つ準備中ですが、これも成果が出たら共有させていただきます。
  • Haebom
👍😀
13
誰がヒューマノイドロボットを作るのですか?
数年前、LG電子のロボット部分で働いていた弟がマキナラックスに引っ越していると言った時が、おそらく私がロボット産業について初めて詳しく覗き始めたのだろう。その前まで何ロボット掃除機、ロボットアームなどを使ってみて利用したことはありますが、これを誰がどのように作ってどのように動作するのか気になっていたのは初めてでした。そしてその関心は長く続かなかった。幼い頃、アドゥイノで簡単な繰り返し作業をするロボットを作ったり、ラズベリーパイで認識して障害物を避けるロボットくらい作ってみたのが全部だった私としては、実はちょっと難しかったし、当時カカオブレインで離職を控えて勉強することが多く、深く考えることはできませんでした。 そこで、2023年頃の論文を見たところ、Multimodalを利用してロボットアームを学習させて特定の家事労働を遂行できるようにするデモが含まれていました。以来、このような論文はありませんでしたが、当時は非常に印象的でした。以後、テスラのオプティマスやフィギュア01のようなモデルを見ながらヒューマノイドが完全に言えない話ではないかも?という考えが徐々に聞こえ始めました。実際、製造工場に行くと、ロボットアーム(robotic arm、mechanical arm)は思った以上に精巧によく作られます。私が直接見たのがH企業造船所でしたが、その時が2023年だったので、今はさらに発展していると思います。そしてこの分野でよくやっている国内企業も多いですね。 ヒューマノイドの場合は若干異なります。ロボットアームは、結局、線がつながっているために電力を着実に供給され、複雑なコンピューティング計算をするのに比較的高速で簡単です。ただ、ヒューマノイドの場合、完全に独立して動くので、バッテリーから演算能力まで取り出さなければならないことが多いですね。実はそれですごくエージェントな話だと思いました。今回の2025年、NVIDIAのPhysical AI セッションを見るまでのことです。実は3月から整理したのですが、先延ばしにしてこうして投稿が遅れました。過去のデータセンターと同じフォーマットで書いてみました。 実際、上記のようにヒューマノイドロボットについて各種コンサルティング会社でまとめた資料を見ると、普通ヒューマノイドの分野?駆動系?を12個程度に分けるようです。頭(頭)、肩(肩)、肘(エルボー)、ウエスト&骨盤(ウェイスト&ペルビス)、手(ハンズ)、上腕(上腕)、前腕(前腕)、太もも(高)、ふくらはぎ(Calf)、足(フィート)私も勉強する立場なので、反論時にあなたが正しいです。 2024年には約32億8千万ドル規模から2032年には660億ドルに拡大すると見込まれ、これは年平均45.5%の成長率に相当します。さらに、近年の製造コストが40%も急減し、以前の予想値(年15~20%減少)をはるかに上回り、産業用途や投資時期が一層早まった。私は12の主要部品カテゴリー全体を一つ見て、特に価値の高い分野に焦点を当てて投資価値をマッピングしてみました。 手の重要性:洗練された操作がバリューチェーンを導く 私が最も目に見たのは「手」部品です。ロボット1台あたりの部品コストが9,500ドル(全体費用の17.2%)で断然最高です。おかげで、2032年までに約35億ドル規模の専用市場が形成される見込みです。人間ほど繊細ながらも丈夫でなければならない技術的難度がこの市場を育てています。 Novanta Inc. (NASDAQ:NOVT):エンドエフェクター技術と多軸(force/torque)センサーを提供 FANUC Corporation(TYO:6954):6軸力感知センサーの製造 Teradyne Inc. (NASDAQ:TER):Universal Robotsの買収後にエンドエフェクターソリューションを強化 Shadow Robot Company:24自由度、20個の駆動モーター、100個以上のセンサーを備えたDexterous Hand SCHUNK GmbH:モジュラーグリッピングシステム Figure AI:2024年2月、6億7,500万ドルの投資誘致(企業価値26億ドル) 私が特に注目したのは人体肌を模写した多層触覚センサーとテンドン駆動システムです。この2つが狭い空間でより多くの自由度を実現しながら、触覚センサー市場は2030年までに355億ドルに達すると言われています。このような触覚センサーはヒューマノイドではなく、さまざまな場所で使用されると思います。 下半身部品:モビリティと安定性の基盤 太もも・ふくらはぎ・足部品はヒューマノイド全体のコストの38.6%を占めます。いわゆる橋部門はロボットの「歩き方」を決めるために投資機会が大きい。太もも・ふくらはぎの場合、2024年基準、市場規模各4億3,300万ドル→2032年87億1,000万ドルで急速な成長を予測しており、これを地面と連結する足部分も2025年8~9億ドルを予想するとします。 Emerson Electric、Thomson Industries(Altra Industrial Motion):高負荷リニアアクチュエータ MISUMIグループ:精密機械部品 Bosch Rexroth:高出力電動アクチュエータ Agility Robotics: Digit 2族歩行ロボット用アクチュエータ 図AI:次世代下半身アクチュエータ
  • Haebom
👍👍🏻
5
(私が知っている)バイブコーディングのすべて
「AIを活用して月千万ウォンは簡単に稼ぎました!」 「人工知能で数億ウォンの副収入を上げました」 スレッドやインスタグラム、カカオトークを開くたびに人工知能で収益を上げたという華麗な成功談があふれます。毎日のように上がる文を見て、正直羨ましさよりは疑問が先に聞きました。私の周りにはAIを研究したり、直接モデルを開発する人が多いのですが、実際の技術を開発したりサービスを構築する人よりも皮肉なことに人工知能講義をしている方が、より速くて大きな収益を上げているようです。長い間ITでご飯をやってきましたが、私が経験した現実はそんなにドラマティックではなかったんですよ。 そんな中、昨年から好奇心半分、楽しい半分で人工知能コーディングツールをあれこれ試してみました。最初は、単にメンテナンスや小さなスクリプトを書くほどに使ったツールが、ある瞬間からは予想外の収益をもたらし始めました。これをより体系的で目的的にすることは、まさにアンドレイ・カパシー(Andrej Karpathy)という名前ですか? 「バイブコーディング」です。 ここ数ヶ月間、私はCursor 、 Replit 、 Trae 、 V0 、 Copilotなど、さまざまなAIコーディングツールを使って、最近はWindsurfやLovableのようなツールも書いています。直接使ってみるとツールごとに明らかな特性と違いがありましたね。コーディング経験が全くない人が素早くプロトタイプを作るときに有利な「コールドスタート」ツールと、すでにある程度コーディングをすることを知っている人が生産性を爆発的に引き上げるときに良い「ブースト」ツールに分けることができるという事実も知りました。 もちろん私の勝手に分けたので何の意味もありません! ツール 分類 主な特長 一行平 Lovable コールドスタート フロントエンド、デザイン、バックエンド統合の自動化 Supabase(データベース)と電子メールの統合 ITであり、考えが明確であるとき使い勝手よい。 Replit コールドスタート/ブースト ブラウザベースの開発環境 展開とオートスケーリング、ホスティング モバイルアプリとして利用可能
  • Haebom
22
👍👍🏻
96
人工知能とのコミュニケーション:エンジンレイヤーとインタラクションレイヤーのバランスをとる
あなたがレストランに行ったと想像してみましょうか?あるレストランではメニューを受け取り、別のレストランではメニューなしでウェイターと自由に会話する必要があります。メニューがあれば簡単に注文できますが、メニューにない注文は難しいです。一方、ウェイターとの自由な会話は可能性は無限ですが、何をどのように要求するのか心配する必要があります。 今日、私たちが人工知能(AI)とコミュニケーションする方法も、この2つの方法に分かれています。前の記事で説明したように、効率性とパフォーマンスを中心としたLLM(Large Language Model)ベースのインターフェースがある場合は、人間の経験に基づくインターフェースも必要です。これら2つのアプローチは、互いを排除するのではなく、それぞれエンジン層とインタラクション層という別々の層で共存できます。 以下の記事から続きます。 1.エンジン層:プロンプト管理とモデル最適化の世界 前述のファインチューニングに関する記事で述べたように、人工知能を効果的に活用するためには、エンジン層の理解が不可欠です。 私が運営する3blocks.aiを通じて様々な企業のAI導入を支援しながら発見した事実は、多くの企業が「人工知能を少し書いてみよう」という簡単な考えから始まりますが、実際にはその導入プロセスが決して簡単ではないという点です。特に閉鎖ネットワーク環境では単にAPIをインポートするのではなく、データの前処理からモデルサービングまで全過程を直接構築しなければならないことが多いです。 エンジン層で重要なのは: プロンプト管理:PromptHubやLangSmithなどのツールを使用して、プロンプトをGitコードのようにバージョン管理して最適化します。 RAG(Retrieval-Augmented Generation) :関連情報を検索してモデルの応答を増強する技術で、企業内部データとLLMを効果的に連結します。 ファインチューニング:特定のドメインや業務に合わせてモデルを追加学習する過程で、法律文書の要約や医療記録分析などの専門分野に活用されます。 ただし、GPT-4oのシステムプロンプトを見ながら悟ったのは、実際の研究分野でもプロンプトはそれほど複雑ではないということです。どのように出力するか様式を決める程度を「エンジニアリング」と呼ぶには、民望的な面があります。結局のところ、重要なのは、賢明なプロンプト技術ではなく、実際のトラブルシューティングに適したアプローチを見つけることだと思います。 2. インタラクションレイヤー: ユーザー中心の経験設計 一方、インタラクションレイヤーは、ユーザーがAIとどのようにコミュニケーションし、作業するかに焦点を当てます。インテルのケースで見られるように、AI技術の受け入れにおける経験の影響はかなりあります。使用経験のある人の64%が次のアップグレードでもAI PCを考慮したのに対し、経験のない人の中では32%だけが肯定的な態度を見せました。 直感的なインターフェースを提供することは、複雑なAI技術を一般ユーザーも簡単に活用できるようにするためのコアです。 インタラクションレイヤで注目すべき点は: 視覚的な流れとコンテキスト:MiroやTanaのようにユーザーの思考を視覚的に拡張できるインターフェース設計 アクセシブルなUI :複雑な命令の代わりに直感的なボタンとメニュー構造 コンテキストの維持:ユーザーの作業コンテキストを理解し記憶する継続的な相互作用 最近多くの注目を集めているIdeogram AIのように、タイポグラフィやロゴデザインなどの特化された領域でのインタラクションレイヤの重要性はさらに顕著です。技術の複雑さを隠し、創造的な表現に集中することを可能にするインターフェースがユーザーエクスペリエンスの核心です。 3. ハイブリッドインターフェースの未来 それでは、これら2つの層はどのように会うべきですか?理想的なハイブリッドインターフェイスは次のような構造を持つべきだと思います。
  • Haebom
👍
3
Metaの最初のLlamaCon 2025を見て
過去数年間に生成されたAI分野で最も注目されている名前の1つは、断然メタ(Meta)のLlamaシリーズです。そんなメタが今年初めてLlamaConという名前の大規模会議を開催しました。今回のカンファレンスではメタが考えるAIの未来方向とビジョンをしっかり垣間見ることができました。私が直接参加しながら得たインサイトを、公式発表された内容とまとめて共有します。 モバイルアプリで日々に近づいたメタAI LlamaCon 2025で最も注目を集めた発表の1つは、 Meta AIスタンドアロンモバイルアプリのリリースでした。このアプリは最新モデルのLlama 4に基づいており、テキストと音声ベースの自然な会話だけでなく、画像の作成と編集も可能です。メタのさまざまなプラットフォームデータと連動して、各ユーザーにパーソナライズされたディスカバリフィードまで提供します。 特に興味深かったのは、このアプリがRay-Banのスマートガラスと統合されるという発表でした。スマートグラスを通じてAIアシスタントをいつでもどこでも自由に活用できるという点で、メタがウェアラブルAI時代の可能性を本格的に開いたと見られます。 12億回ダウンロードを突破:オープンソースAIの成功方程式 Llamaの人気はすでに証明されています。 Llamaシリーズは発売約2年ぶりになんと累積ダウンロード12億回という記録を立てました。 2024年12月6.5億回 2025年3月10億回 最近12億回突破 この驚くべき成長の秘訣は、メタが採用したオープンソース戦略と強力なカスタマイジング機能のおかげであると言えます。今後、より多くの開発者や企業がこのオープンソースのAIエコシステムに飛び込んでいるようです。 Llama APIリリース:オープンソースとAPIの完全な組み合わせ 今回のカンファレンスで個人的に最も関心を持って本発表がまさにLlama APIの公開でした。限定されたプレビュー形式で提供されるこのAPIは、開発者がLlamaモデルを簡単に呼び出してカスタマイズするのに役立ちます。 PythonとTypescript SDKのサポート OpenAI SDKと完全互換 CerebrasとGroqと協力して迅速な推論環境を提供 独自のデータで微調整(Fine-tuning)まで可能 特にメタが強調したのは、開発者が作成したカスタムモデルとその重みを完全にユーザー所有と認めるということです。これは、データとモデルの主権に関する重要なメッセージとして受け入れられています。 Llama Stackの企業環境の拡大 メタは、Llama StackをエンタープライズクラスのAIソリューションに発展させるために、 NVIDIA NeMo、IBM、Red Hat、Dellなどのグローバル企業との協力拡大を発表しました。このパートナーシップは、企業がさまざまな環境でもLlamaを簡単に運営できるようにすることを目的としています。これは、特にセキュリティとパフォーマンス、費用対効果の両方を備えなければならない金融、医療、公共機関などに大きな関心を集める見込みです。最近、以下のようなニュースを見ましたが、これもこういう行道の一環かという考えも聞きました。 セキュリティまで気にするオープンソースAIエコシステム構築 オープンソースモデルを使用する際の最大の懸念の1つがセキュリティ問題です。メタは今回の発表で、これらの懸念を解決する様々なセキュリティツールを公開しました。
  • Haebom
👍
2
Googleの面白い実験室
以前にGoogleの挑戦について印象が深く、上のような文を書いていましたが、しばしばGoogleが何をしているのでしょうか? そのため、最近下記のサイトをお勧めします。名前の通りGoogleのラボのようなところです。 https://labs.google/ 地元の人のように自然に語る「スラン・ハング」 外国語を学ぶと、通常教科書的な文章を先に学ぶことになります。ところが実際の現地人たちは教科書とは違って、時にはスランや口語体表現を自然に使用します。この点を補完したのがまさに「スラン行」です。 この実験では、地元の人々の実際の会話の流れを1メッセージずつ見ながら、実際にどのように話が続くかを自然に学ぶことができます。街の商人とゲストの会話や地下鉄で久しぶりに出会った友達の話に従いながら、鮮やかな表現を身につけることができます。 カメラで学ぶ新しい単語「ワードカム(Word Cam)」 「ワードカム」機能は、周囲の物を撮ると、AIがその写真の中の物体を認識し、学んでいる言語でラベルを付けてくれる方式です。 キャリア旅程を設計し、関連職務推薦をするCaerer Dreamer 今お話しするのはごく一部であり、GoogleのLabsとAI Studioを行ってみると、Geminiのマルチモーダルを活用した様々な試作品と事例を共有しています。みんなOpenAIとClaude、Deepseekだけが好きなようで、一度Googleも非常によくやっているという意味で一度共有させていただきます。
  • Haebom
👍
1
イロンマスクの「DOGE」実験は終わったか?
最近、米国で最も熱い議論の1つであったイロン・マスクの「政府効率省(DOGE)」実験が事実上幕を閉じています。今、マスクはまた本人の本業であるテスラとxAIに復帰すると宣言しました。彼のこの宣言は一体何を意味し、DOGEはこれまでどんな成果と議論を残したのでしょうか。 🚩DOGEとは何ですか、なぜ作成されたのですか? イロン・マスクが大統領選挙期間中に強調した公約の一つは、 「政府の非効率を減らす」ということでした。そのために政府内の前例のない新しい組織を創設しました。名前によって政府効率省(DOGE) 。はい、この名前は彼の有名な「Dogecoin」に対する愛情深い冗談でもありました。彼の初期のコミットメントは驚きました。 2兆ドルに及ぶ膨大な政府予算の削減を約束し、多くの支持者から拍手を受けました。しかし、この約束はしばらくして現実的な問題に直面します。 📉予想と現実の乖離:約束された成果は達成されましたか? DOGEが実際に成果を出したことを確認するためのWall of Receipts(領収書の壁)というウェブサイトが公開されました。ここでは、マスクの節約額が透明に公開されると言いました。しかし、現実は違いました。 最初の2兆ドルだった目標はわずか数ヶ月で1兆ドルに縮小され、再び1,500億ドルまで急激に低くなりました。さらに、公開された領収書で計算錯誤と情報不足が明らかになり、信頼性に大きな打撃を与えました。 結局のところ、メディアと専門家はDOGEの成果について疑問を投げかけました。 ⚖️DOGEを眺める2つの視線 DOGEの評価は現時点では非常に分かれています。 ポジティブな視線:マスクの試み自体が意味があったと見る視点です。放浪した政府支出と非効率的な行政を少しでも振り返らせたという評価です。特に若い有権者やマスクファンは、彼が既存の政治権があえてできなかった問題提起をしたと評価します。 批判的視線:一方、否定的な立場では、DOGEが「非現実的な目標」と「不正確な数字」で、むしろより大きな混乱と不信を引き起こしたと考えています。公約と現実の差が大きすぎて、重大な国家予算問題を軽く扱ったという批判が代表的です。 個人的にはこれが気になりました。米国政府にとってこれが詐欺罪成立になるのか?テスラやXAIなどの創業者であり経営者として背任罪に該当するのか? 気になって米国連邦法と各州法を探してみるのに詐欺(Fraud)に対する要件は以下の通りだったんですよ。見なければならないようです... 判断要素 法的要件(米国基準) DOGEの現状 ①虚偽の事実か 客観的に間違った数字を提示する必要があります 「8億→80億」などの単位エラー、契約種類誤解など多数の計算錯誤が確認される ②故意‧無謀性(Intent or recklessness) プレゼンターが偽であることを知っていても、それが分かったのに無視したのか
  • Haebom
最高のコンディションを作る24時間の使い方
最近、YouTubeで非常によく見られる単語は「脳科学」です。脳の科学的原理を理解してLife Hackingして自分の人生を最適化するというのはとても魅力的なコンセプトのようなものですが、実際にどの程度まで可能なのかよく感じられません。 2019年くらいに周辺の人々にメイクタイム(Make Time)という本をめちゃくちゃ営業していましたが、その本にあった内容がたくさん思い出しました。書籍の内容の概要を周りの人に伝えましたが、当時の反応は良かったです。 そんな中、久しぶりにジェイクナップと海外ポッドキャストの話を聞くのに脳科学までは知らず、内分泌系やホルモン、脳の特徴によって推奨するルーチンがありました。 私たちがしばしば「時間管理」と言えば、ほとんどの仕事リスト(To-do list)を考えます。しかし、本当の効率的な一日は単に仕事を処理するのではなく、私たちの脳と体が持つ自然なリズムに合わせて生活することです。 そこで今日は最新の脳科学研究と信頼性の高い資料をもとに、最も理想的な一日の時刻表を皆さんと一緒に作ってみたいと思います。私たちがなぜ特定の時間帯に特定の行動をしなければならない最も効率的なのか、これらすべての科学的理由を次々と一緒に調べました。 🌙夜:十分な睡眠はすべての始まりです(23:00 – 06:00) 私たちの脳は寝るとき初めて最も重要な仕事をします。すぐに記憶を整理し、脳の老廃物(ベータ-アミロイドなど)を排出することです。 少なくとも7時間以上の睡眠は、記憶力、集中力、創造性を高め、脳の毒素を除去する「脳洗浄」作用をします。 自己前最低1時間はスマートフォンのようなブルー​​ライトを遮断し、安眠ホルモンであるメラトニン分泌を妨げないようにすることをお勧めします。 ✨実践のヒント:就寝の1時間前にスマートフォンを離れて置き、代わりに軽いストレッチや瞑想をして一日を終えてください。 🌅朝:脳を目覚めさせるゴールデンタイム(06:00 – 09:00) 朝の気象直後30分はコルチゾールが急上昇し、私たちの脳が最も速く、明瞭に働く時間です。この時、日光を当てると脳の生体時計がリセットされ、一日を積極的に始めることができます。 気象後すぐに日光を浴びて軽いストレッチをすると、気分が良くなり、一日中集中力が維持されます。 簡単な自己啓発(読書、計画立て、瞑想)で一日の方向をつかみましょう。 ✨実践のヒント:朝起きたらすぐにカーテンを開き、窓辺で5分間日焼けして深呼吸してみてください。素晴らしい効果を体験してください。 🚀午前作業集中時間(09:00 – 12:00) 私たちの脳は一日二回集中力が最高潮に達しますが、そのうちの最初は午前時間です。したがって、一日の中で最も困難な仕事や創造的な作業をこの時間に配置すると効率が高くなります[^4]。 集中時間には90分業務 - 10分休憩周期を守ってください[^4]。 午前中は、できるだけ邪魔されないように外部からの連絡を遮断することをお勧めします。 ✨実践のヒント:午前2〜3時間はメッセンジャーの通知をオフにし、スマートフォンもしばらく離してみてください。本当の没入を体験できるでしょう。 🍽️ランチ後のエネルギー充電(12:00 – 15:00)
  • Haebom
👍👎
20
教える人も学ばなければならない。
最近、私は大学で機械学習講義を始めました。特講や大衆講演の形では馴染みますが、学部や席・博士生を対象とする15週間の正規講義は初めてなので、より効果的な教授法を探そうと様々な資料を見ています。その中でも特に印象深く感じられた3つの教授法を皆さんと共有したいと思います。これはシェーピング、チェイン、チャンキングです。二つの授業をしていますが、思ったより教えながら学ぶことも多かったです。良い機会となっています。兼任ではありますが…教授の声を聞くのもそれなり不思議です。 1. シェーピング(Shaping): 全体の流れを見せながらフォローさせる シェーピングは、全体の流れやプロセスを最初から最後まで一度にデモンストレーションし、生徒がそれを模倣するように誘導する方法です。機械学習の授業でもとても効果的です。 たとえば、学生に初めてロジスティック回帰モデルを教えると、最初にワークフロー全体を簡単な例として直接説明します。データの前処理からモデル学習、評価まで一目でわかるように構成し、生徒が全体の過程を直感的に理解するのに役立ちます。その後、生徒に同じプロセスを自分で実行させ、その過程で発生する問題についてすぐにフィードバックを提供することがより効果的です。 2. チェイン: 複雑なプロセスを段階的につなぐ チェーンは、複雑なタスクをいくつかの小さなステップに分け、各ステップで明確に学習した後、徐々にプロセス全体をリンクする方法です。これは、機械学習のように複雑なプロセスが多くの分野で特に効果的です。 例えば、ニューラルネットワークモデルの構築を例にとると、データの前処理、モデル設計、学習、評価の各段階をそれぞれ別々に教えた後、生徒がこの個々のステップをよく理解したら、全体のプロセスを1つの完成したパイプラインにリンクします。特に、最終評価結果を先に見せて「この結果が出るまでどのような段階があったのか」逆順に近づく逆方向チェーン方式を活用すれば、学生の学習動機と理解度をさらに高めることができます。 3. チャンキング: 複雑な概念を小さく分けて学ぶ チャンキングは、複雑な作業や概念を小さく、管理可能な単位に分けて個別に学習した後、これを再結合して全体を完成する方法です。機械学習でも非常に便利に適用できます。 たとえば、サポートベクトルマシン(SVM)を教えるとき、私は概念の説明、カーネルの意味と機能、実際のコード実装などの詳細な要素をそれぞれの「チャンク」に分けて個別に扱った後、学生がこれらのチャンクを十分に理解すれば全体モデルを構築しようとします。できるようになります。 そして教授職をしてみて感じるのですが、思ったより学校側で教授を対象とする教育や福祉より進んで、力量強化プログラムが多かったです。ほとんど無料でクオリティも高くていいようです。もちろん今、私がしたことのある学校が国民大学、高麗大学だけなので、他の大学はどうなのかわかりませんが、思ったより学生の時とはまた完全に違う感じの教員の方々に接するようになって不思議でした。すでに中間試験期間が終わり、今は期末です。今回知りましたが、試験期間は学生だけでなく教授も大変でした…学部の時、あまりにも教授に憎まないでくださいました。
  • Haebom
👍
1
サムスンはなぜLlama 4を選んだのですか?
最近、サムスン電子半導体部門(DS)がメタの最新大規模言語モデル(LLM) LLaMA4を全組織に電撃導入したという記事を見ました。個人的にはなぜ、あえて性能論議とベンチマーク操作疑惑まで浮かんだLLaMA4を選択したのでしょうか? サムスン電子DSの選択とその背景 サムスン電子が導入したLLaMA4は、 Scout(軽量モデル)とMaverick(基本モデル)で構成されたマルチモーダルAIです。感じたようですが、実際にこの選択が最善だったかどうか疑問が残ります。 パフォーマンスとベンチマークの信頼性の議論 LLaMA4は発売直後からパフォーマンスに関するいくつかの議論がありました。一部の研究者と開発者コミュニティでは、LLaMA4が提出したベンチマークモデルが実際に公開された重みと異なるという疑惑が提起されています。内部社員から「ベンチマークスコアを引き上げるための無理な調整があった」という暴露まで出てきました。 このような議論は、企業が重要な業務データを扱う際に考慮するしかない重要な問題です。サムスンのようにプロセスの最適化と信頼性が必須の企業が選んだモデルとしては、かなりリスク負担が大きな決定だったという感じを消せません。 実際、個人的には今回のLLaMA4導入自体が、ただの職員向けに選択肢の一つを作ったのですが、何か言論で侵略棒だったのではないかという考えがあります。 より効率的な代替案:Gemma3 QATの存在 実際、市場には、LLaMA4に加えて、優れた性能と効率性を示す代替案がありました。たとえば、 Gemma3 QAT(27B)は、比較的少ないハードウェアリソースでも優れたパフォーマンスを発揮するモデルとして評価されます。もちろん、そもそもQAT自体が一般消費者レベルのコンピューティングパワーでもスムーズに回せるLLMであることを勘案しても…何かメバリックを金出して書くには残念に見えるのが事実でしょう。サムスンくらいの企業ならコミュニティ版を使うわけでもなく、有料モデルを使えそうです。 アイテム Llama 4 Scout (109 B/17 B アクティブ) Gemma 3 27B QAT マルチモーダル テキスト・画像・音声・映像同時処理 テキスト・画像(音声X) コンテキスト長 10Mトークンズ(Maverick 1M) 128 Kトークン 推論速度 120 tps (FP8、H100 1枚) 20-25 tps(INT4、RTX A5000)
  • Haebom
👍
2
あなたの製品・サービス・ライブラリーの主なお客様は今LLMです
「カラフルなカラーパレットとアニメーションでいっぱいの洗練されたドキュメントページは疲れています。一方、シンプルな単一のマークダウン(.Md)ファイルと「クリップボードのコピー」ボタンの1つが新しい人気です(Wired)。 最近カッパシの記事を読んで深く共感した理由は簡単です。私たちが作る製品やサービス、ライブラリの主な対象顧客が、今はもはや人ではなく、人工知能になったからです。 LLM時代の到来:機械に優しいインターフェースの怪我 最近、OpenAIのMCP(Model Context Protocol)やChatGPTのデスクトップアプリで提供するコラボレーション機能(「Work with」)を使ってみた方は感じましたが、UIが人よりも機械、つまりLLMが理解しやすい形であるほど、はるかに効果的に活用されます。これは、従来のユーザーエクスペリエンス(UX)の概念を新たに定義するフローです。 その間、私たちは美しいインターフェースとフレンドリーな説明で人に最適化されたUIを作成してきました。しかし今、状況は変わりました。ますます多くのことが人の代わりにLLMやエージェントを通じて行われているからです。 なぜLLMは人のためのUIを嫌うのですか? LLMが人のための複雑でカラフルなインターフェースを消す理由は明らかです。 LLMはナビゲーションではなくスクレイピングが必要です。複雑なメニューやナビゲーションよりもシンプルで明瞭なテキスト構造が必要です。 LLMは視覚刺激ではなくテキストを好む。アニメーションや動画よりも簡潔なテキストで情報を提供する方が効率的です。 LLMはクリックではなくカールが好きです。リンクをたどり、クリックするのではなく、API形式で提供されるデータに直接アクセスすることを好みます。 これらの特徴は、LLMがますます多様な分野で市販されており、私たちの日常に深く着くほど重要になります。 製品開発者とサービスプロバイダの新たな課題 今、開発者とサービスプロバイダは、彼らの製品とサービスをLLMに優しく変える必要がある時が来ました。これはUIの本質的な変化を必要とします。 すべての機能は、できるだけテキストベースで簡単に表現できるはずです。 データをAPIまたは最小限の文書形式で明確に提供する必要があります。 マークダウンなどの単純なフォーマットを積極的に活用して、LLMが理解しやすい構造で情報を整理する必要があります。 バックテキストの時代に? 技術の発展は常に予測よりも速く行われ、今回のLLM中心のインタフェースの変化もすぐに私たちのそばに近づくでしょう。現在、MCPなどのプロトコルやLLMに優しい機能がますます標準化されていることを考えると、今でも製品とサービスの提供方法を​​再整備する必要があります。以前に上記のような文を書いたのですが、すでに盛大な声が近づいてくるようです。 あなたの製品が未来に生き残るためには、「LLMが好きな」製品に変える必要があります。簡潔で効率的で簡単にアクセスできる形に変わらなければなりません。今、あなたの製品やサービス、ライブラリを振り返り、一度考えてみてください。 「私の主な顧客がLLM(人工知能)だったら、この機能はどう変わるのでしょうか?」
  • Haebom
👍
5