Python: 層化抽出法を使ったK-分割交差検証 (Stratified K-Fold CV)

momijiame https://blog.hatena.ne.jp/momijiame/ CUBE SUGAR CONTAINER https://blog.amedama.jp/ macOS Python 機械学習統計 scikit-learn K-分割交差検証 (K-Fold CV) を用いた機械学習モデルの評価では、元のデータセットを K 個のサブセットに分割する。そして、分割したサブセットの一つを検証用に、残りの K - 1 個を学習用に用いる。上記の作業で、元のデータセットを K 個のサブセットに分割する工程に着目してみよう。果たして、どのようなルールにもとづいて分割するのが良いのだろうか？このとき、誤ったやり方で分割すると、モデルの学習が上手くいかなかったり、汎化性能を正しく評価できない恐れがある。今回は、分割方法として層化抽出法を用いたK-分割交差検証 (Stratified K-Fold CV) について書いて… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fblog.amedama.jp%2Fentry%2F2018%2F08%2F25%2F174530" title="Python: 層化抽出法を使ったK-分割交差検証 (Stratified K-Fold CV) - CUBE SUGAR CONTAINER" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://images-fe.ssl-images-amazon.com/images/I/415QwBMiAcL._SL160_.jpg Hatena Blog https://hatena.blog 2018-08-25 17:45:30 Python: 層化抽出法を使ったK-分割交差検証 (Stratified K-Fold CV) rich https://blog.amedama.jp/entry/2018/08/25/174530 1.0 100%