pandas + matplotlibで描くヒストグラムいろいろ

ejinote https://blog.hatena.ne.jp/ejinote/ 天色グラフィティ https://amalog.hateblo.jp/ Python データ解析データ解析コンペの初期段階では、データを可視化して眺め、特徴を探すという探索的データ分析(EDA)が行われます。 Pythonでデータ分析している場合、可視化にはpandasのプロット機能、もしくはmatplotlibを使うことが多いでしょう。今回はヒストグラムに絞って、僕が良く使っている書き方を紹介したいと思います。題材とするデータにはKaggleのTitanicコンペのデータを使うことにしましょう。一部を抜き出してくるとこんな感じのデータになっています。今回はこのAgeの列を可視化してみたいと思います。 data = pd.read_csv('input/train.csv') dat… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Famalog.hateblo.jp%2Fentry%2Fvarious-histograms" title="pandas + matplotlibで描くヒストグラムいろいろ - 天色グラフィティ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/e/ejinote/20180423/20180423105748.png Hatena Blog https://hatena.blog 2018-04-23 18:00:00 pandas + matplotlibで描くヒストグラムいろいろ rich https://amalog.hateblo.jp/entry/various-histograms 1.0 100%