１時間後の競馬の予測をするために、データクレンジングを２時間しても、意味は無い。

xmldtp https://blog.hatena.ne.jp/xmldtp/ ウィリアムのいたずらの、まちあるき、たべあるきーPART2 https://xmldtp.hatenadiary.org/ AI・BigData データクレンジングはたしかに大事。でも、銀行の名寄せとは違い、データ解析の場合、「手持ちのデータをすべてクレンジングしないと処理できない」というわけではない。そもそも、１時間後の競馬の予測をするために、データクレンジングを２時間しても、意味は無い。クレンジング後に予測をして、レースが終わった後に当てても、何の意味も無い。この場合、データクレンジングよりも、予測時間のほうが重要になる。では、どうするのか？この場合は、乱数を振る。すべてのデータをクレンジングし、処理する時間がないのであれば、限られたデータをクレンジングし、処理するしかない。データを(無作為に）限定し、絞り… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fxmldtp.hatenadiary.org%2Fentry%2Ff1d05ba212f93cb45d84fbdcac4aa609" title="１時間後の競馬の予測をするために、データクレンジングを２時間しても、意味は無い。 - ウィリアムのいたずらの、まちあるき、たべあるきーPART2" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2013-06-04 11:53:30 １時間後の競馬の予測をするために、データクレンジングを２時間しても、意味は無い。 rich https://xmldtp.hatenadiary.org/entry/f1d05ba212f93cb45d84fbdcac4aa609 1.0 100%