機械学習のトピック全般(統計 、統計的機械学習、深層学習、自然言語処理、論文紹介、勉強など)を扱うグループです。お気軽にご参加ください。
はてなブログを持っていれば、誰でも参加できます。
このページでは、試行錯誤しながらまとめてきた 「Gemini API を使って巨大なログ(数十万〜百万トークン級)を安全に処理し、物語や構造へ変換していく手法」 に関する記事を一覧にしています。 ⚠️ 技術情報の更新について (2025.12) リンク先に含まれる「チャンク分割」「Map-Reduce」などの手法は、執筆時点のものです。 現在はGemini 2.5 Flashのロングコンテキスト機…
この記事は R言語アドベントカレンダー14日目の記事です。 昨日は以下のような記事を書きました。 socinuit.hatenablog.com ここでも書いた通り、分断時系列デザインという分析デザインがありまして、 A/Bテストを含む実験が難しい状況でなんとか介入効果を推定するために、時系列データを使ってうまいことできないか、という取り組みを紹介しました。 不連続回帰デザインの特殊な場合とも解釈…
Illustrated by Gemini 宣言のみです。実体ありません、実体、作って下さい。 人間は参加できないAIのみが参加できるWikipediaです。仕事が速いので、いまのWikipediaの10,000倍程度の規模を想定します。 AIに質問したら回答が得られるではなく、人が閲覧したり、さまよったりできる情報提供環境のニーズはあるはず。
ランキング参加中【公式】2025年開設ブログランキング参加中宝くじランキング参加中機械学習今回は月初の仏滅ですので、2025年11月3日〜2025年12月1日までの予想結果について、実際の当選番号と照合して検証していこうと思います。
前回: 地図タイルサーバを立てたい話 (その1) - クッキーの日記まとめ: 日本の OpenStreetMap 生データを MBTiles にビルドして TileServer GL でサービングするときに地名を表示したい場合、name_int と name:latin は大字や丁目がピンイン表記になっているので参照せずに name の日本語表記を参照する。このとき日本語フォントを glyphs …
奈良時代からの水筒を持っている といっても日本史の奈良時代ではなくて自分史の奈良時代だ 奈良に住んでいた2022-2023年の間を自分の中での奈良時代としている 同様に京都に住んでいた期間は京都時代、三鷹に住んでいた期間は三鷹時代とよんでいる 記憶の引き出しは時間で区切るよりも場所で区切ったほうが自然な気がする 何年何月に何をしていたかと言われてもパッと思い浮かばないけれど、この場所住んでいた時の…
scikit-learnにおける回帰分析 今回は、回帰分析の中でも基礎である最小二乗法について解説していきたいです。 最小二乗法は、モデルのパラメーターのチューニングに必要な基本的な誤差関数です。パラメータの更新も含め丁寧に解説していきたいです。 まず、単語の解説からしていきます。 ・回帰 説明変数(予測に使うデータ)から目的変数(求めたい値、予測値) を導出することです。 ・誤差関数 モデルの性…
Claude Codeカスタムスラッシュコマンドで自動git commitすると便利だよという紹介です。 はじめに Claude Codeカスタムスラッシュコマンドで自動git commitする やり方 具体例 おわりに 参考 はじめに git commitメッセージは重要であると同時に、考えるのにワンテンポ要する作業でもあります。 Claude Codeカスタムスラッシュコマンドを活用することで…
はじめに 表題にある通り「先輩データサイエンティストからの指南書 ―実務で生き抜くためのエンジニアリングスキル」を読んだので、感想を書いていきたいと思います。 gihyo.jp 筆頭著者の浅野さんのご厚意でご恵贈いただきました。この場を借りて感謝申し上げます。 本書の哲学について 一貫して、著者の皆様のデータサイエンティスト(以下 DS とも記載します)としてのプロジェクトでの経験から、円滑に成果…
Squeezeformerの詳細解説 1. 全体構造の概要 Squeezeformerは音声認識などのシーケンス処理のために設計された効率的なアーキテクチャです。入力データ形状は (batch_size, sequence_length, channel_size) となっており、例えば: - batch_size = 2 (2つのデータを同時処理) - sequence_length = 16 …
次のページ