Python:PDFMiner使い、東京証券取引所日報からテキスト抽出・CSV保存

PageTAKA https://blog.hatena.ne.jp/PageTAKA/ pagetakaBlog https://pagetaka.hatenablog.jp/ PC、ネット、情報端末 Python 前説：これまでもやってきたが…無様なスクリプトが気になり…。今回の工夫：全体を「関数型」風に書き換えました。 PDF解析の流れ今回のスクリプトは複数日対応にしていません。 Python:PDFMinerで解析し、CSV保存するスクリプト。【Python:東京証券取引所日報からテキスト抽出で使ったライブラリ】この記事では、ネット上にPDF形式である「東京証券取引所日報」からテキスト抽出する作業を、Python+PDFMinerでおこなったことをとりあげます。最後にPythonスクリプトを載せました。 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fpagetaka.hatenablog.jp%2Fentry%2F2025%2F02%2F03%2F202640" title="Python:PDFMiner使い、東京証券取引所日報からテキスト抽出・CSV保存 - pagetakaBlog" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/P/PageTAKA/20250203/20250203195059.gif Hatena Blog https://hatena.blog 2025-02-03 20:26:40 Python:PDFMiner使い、東京証券取引所日報からテキスト抽出・CSV保存 rich https://pagetaka.hatenablog.jp/entry/2025/02/03/202640 1.0 100%