特徴量(素性)を作るときのメモ + scikit-learnにちょっと触る

sucrose https://blog.hatena.ne.jp/sucrose/ 唯物是真 @Scaled_Wurm https://sucrose.hatenablog.com/ 機械学習 python 機械学習のデータとして特徴量を作るときの注意点や悩むことなどをメモっておきました。間違いなどが含まれているかもしれません。基本的な内容ですので調べればもっと適切なやり方があると思います。カテゴリカル・データカテゴリカル・データというのは、いくつかの限られた種類の値をとり、その大小関係に意味が無いものです。質的データとか名義尺度とか呼ばれることもあります。例えば都道府県のデータを考えた時に、北海道と沖縄は違う値ですが、その大小関係は定義できません。 (もちろん北海道と沖縄に面積的な大小関係などはありますが、欲しい情報ではないとします)カテゴリカル・データを特徴量にするときにはカテゴリー… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fsucrose.hatenablog.com%2Fentry%2F2013%2F04%2F19%2F014258" title="特徴量(素性)を作るときのメモ + scikit-learnにちょっと触る - 唯物是真 @Scaled_Wurm" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2013-04-19 01:42:58 特徴量(素性)を作るときのメモ + scikit-learnにちょっと触る rich https://sucrose.hatenablog.com/entry/2013/04/19/014258 1.0 100%