Python: Target Encoding のやり方について

momijiame https://blog.hatena.ne.jp/momijiame/ CUBE SUGAR CONTAINER https://blog.amedama.jp/ Python 機械学習統計 pandas NumPy データ分析コンペでは Target Encoding という特徴量抽出の手法が用いられることがある。 Target Encoding では、一般的に説明変数に含まれるカテゴリ変数と目的変数を元にして特徴量を作り出す。データによっては強力な反面、目的変数をエンコードに用いるためリークも生じやすく扱いが難しい。今回は、そんな Target Encoding のやり方にもいくつか種類があることを知ったので紹介してみる。元ネタは CatBoost の論文から。 CatBoost: unbiased boosting with categorical features (PDF) 使った環境は次の… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fblog.amedama.jp%2Fentry%2Ftarget-mean-encoding-types" title="Python: Target Encoding のやり方について - CUBE SUGAR CONTAINER" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://images-fe.ssl-images-amazon.com/images/I/41zp6hN7f%2BL._SL160_.jpg Hatena Blog https://hatena.blog 2019-10-31 23:26:30 Python: Target Encoding のやり方について rich https://blog.amedama.jp/entry/target-mean-encoding-types 1.0 100%