SentenceTransformerを用いて文字の意味を加味した特徴量を作成し、有用性を検証しました。

kinopee0120 https://blog.hatena.ne.jp/kinopee0120/ Vポイントマーケティング｜TECH LABの Tech Blog https://techblog.vpoint.co.jp/ データサイエンス SentenceTransformer こんにちは。データサイエンスグループの木下です。今回は、SentenceTransformerを用いて作成した特徴量の有用性を検証したという内容になります。背景テーブルデータを用いて機械学習モデルを作成する際、カラム名自体や値の文字通りの意味を加味することができません。例えば、「職業」というカラムに「学生」「社会人」「主婦」などの値が格納されていたとします。このようなカテゴリー値の場合は、一般的にはone-hot エンコーディングやラベルエンコーディングをして、数値に変換してから機械学習モデルに入力します。この際、「職業」というカラムや、「学生」「社会人」「主婦」という値の、"文… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftechblog.vpoint.co.jp%2Fentry%2F2025%2F02%2F20%2F140311" title="SentenceTransformerを用いて文字の意味を加味した特徴量を作成し、有用性を検証しました。 - Vポイントマーケティング｜TECH LABの Tech Blog" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/D/DBMK_Lab/20250221/20250221153116.png Hatena Blog https://hatena.blog 2025-02-20 14:03:11 SentenceTransformerを用いて文字の意味を加味した特徴量を作成し、有用性を検証しました。 rich https://techblog.vpoint.co.jp/entry/2025/02/20/140311 1.0 100%