はてなブログを持っていれば、誰でも参加できます。
目次 先日のRLHF/DPOの例題の報酬設計時に使った関数で KLダイバージェンス(Kullback–Leibler divergence) があります。 教師あり学習を行う場合でも、よく出てくる関数です。 この関数の性質について説明します。 数学的な定義 KLダイバージェンスは、2つの確率分布 PPP と QQQ の「違い」を測る量です。連続確率変数と離散確率変数の場合で定義が少し異なります。 …
はじめに はじめましてのひとは初めまして。 お久しぶりの人はお久しぶりです。 そうじゃない人はいつもお世話になってます。 というわけで、今日も今日とてアニメ感想日記のはじまりはじまり。 目次 はじめに 目次 本題 見たものリスト Rankの感覚的説明 各作品の短評 【推しの子】第3期 33話(3期 9話) 葬送のフリーレン 第2期 36話(2期 8話) 違国日記 10話 最後に 本題 見たものリス…
はじめに 製品概要 NチャンネルMOSFETを使用した双方向ロジックレベル変換モジュールです。 Groveコネクタ側は3.3V、ピンヘッダ側は5Vになっています。 M5Stack製品と合わせて使うと便利です。 特徴 3.3V <-> 5V 双方向ロジックレベル変換モジュール PLAケースつき 3.3V側はGrove コネクタ 5V側はピンヘッダ 回路図 回路図は下記です。 寸法 基板寸法は下記です…
いや~、まいってます。 今月は減る資産をただただ眺めるばかり。。。 こんな時は「長~~~い目で見てプラスならいいや」の精神で乗り切るのみ。 暴落時にいつも思う事は、「こんな時に現金があればなあ・・」です。 そうなんです。買い増す現金を持っていない。。。 勝つ者がさらに勝つ原理。それは「余力」 私には余力が無い。 今このブログを書きながら、理解したことがあります。 私が現状から抜け出して富を手にする…
Claude CodeでAIエージェントに仕事をまかせていると、実行するコマンドに 2>&1 というコマンドが含まれていることがあります。この2>&1はなにをやっているのか調べてみました。 ストリームとは プログラムの入出力の流れのことです。OSはストリームをファイルディスクリプタと呼ばれる整数番号で管理しており、stdin・stdout・stderr にはあらかじめ 0・1・2 が割り当てられて…
Issue Enhance UIInput events with HTML5 like oninput PR Automatically pass through all on* event attributes 従来はコンポーネント毎に利用可能な on* イベントが既定されていたが、HTML仕様の追加に追従できていなかった。 Jakarta Faces 5.0 (Jakarta EE 12) …
こんにちは、今年の3月からCRE(Customer Reliability Engineering)チームに配属になった s_arikawa です。それまではSmartHRの労務領域の機能開発チームに所属していました。 私はCREになってまだ1ヶ月も経っていないため、「他社のCREチームはどんな働き方をしているのだろう」という関心がありました。ただ、以前から東京で開催されていたCRE Campは、…
www.youtube.com 各企業のウェブ担の方はエイプリルフールに自社のサイトでどんなサプライズを提供するかお悩みかと思います いろんなトリックを仕込めて楽しいのではないか?と思う方もいると思いますが、4月1日は毎年やってきてしまいます。 しかもそのたび担当者が4月1日になったらプログラムを流すということを人手でうやっていると詰むので、「4月1日になったら発動する」という条件をつけて、サイト…
TeamCreateを使った後に/exitして、そのあとにclaude --continueしても継続できないのは自分の環境だけ? claude --resumeの一覧にも出てこなくなる。claude --resume で指定すれば継続できるが、セッションIDをログから探さないといけない。検索しても同じ現象で困っている人を見つけられなかった。 仕方がないので前から欲しかった自動で会話のログを保存す…
次のページ