【分散処理】PySpark ～ DataFrame / 項目数を取得するには～

dk521123 https://blog.hatena.ne.jp/dk521123/ プログラムの超個人的なメモ https://dk521123.hatenablog.com/ Spark / PySpark ■ はじめに https://dk521123.hatenablog.com/entry/2020/05/18/154829 の続き。小ネタ。デフォルト項目名「_c0」などの項目を変更するのに項目数を取得したかったのでメモする目次【１】項目数を取得するには【２】サンプル例１：簡単なサンプル例２：デフォルト項目名「_c0」を変更する【１】項目数を取得するには data_frame.columns で項目名のリストが取得できるので、 len(data_frame.columns) で可能。【２】サンプルテストデータ「input.csv」(ヘッダーなし) x0001,Mike,… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fdk521123.hatenablog.com%2Fentry%2F2020%2F08%2F28%2F183706" title="【分散処理】PySpark ～ DataFrame / 項目数を取得するには～ - プログラムの超個人的なメモ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2020-08-28 18:37:06 【分散処理】PySpark ～ DataFrame / 項目数を取得するには～ rich https://dk521123.hatenablog.com/entry/2020/08/28/183706 1.0 100%