外れ値検出、OneClassSVMについて

Owatank https://blog.hatena.ne.jp/Owatank/ 時給600円 https://owatank.hatenablog.com/ 機械学習統計データにはよく外れ値なるものが含まれていることが多いそう。外れ値とはデータの分布において他の観測値から大きく外れた値のことで、異常値とやらもあるけどそれとは異なるっぽい外れ値検出、処理することは機械学習を行う上で学習の妨げをなくす大切な過程だそうで、行う必要があるので試してみた。一つ目は単純にデータの集合から、第一四分位数、第三四分位数、四分位範囲(IQR)を求めて外れ値を検出する方法を試す。大体のことはこのサイトを参考にした。結果としてはこんな感じに青が元のデータ集合、赤が外れ値の集合こうしてみると外れ値じゃない範囲がとても狭い・・・次に scikit-learn という… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fowatank.hatenablog.com%2Fentry%2F2017%2F09%2F07%2F150656" title="外れ値検出、OneClassSVMについて - 時給600円" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/O/Owatank/20170907/20170907143825.png Hatena Blog https://hatena.blog 2017-09-07 15:06:56 外れ値検出、OneClassSVMについて rich https://owatank.hatenablog.com/entry/2017/09/07/150656 1.0 100%