<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>PageTAKA</author_name>
  <author_url>https://blog.hatena.ne.jp/PageTAKA/</author_url>
  <blog_title>pagetakaBlog</blog_title>
  <blog_url>https://pagetaka.hatenablog.jp/</blog_url>
  <categories>
    <anon>PC、ネット、情報端末</anon>
    <anon>Python</anon>
  </categories>
  <description>前説：これまでもやってきたが…無様なスクリプトが気になり…。 今回の工夫：全体を「関数型」風に書き換えました。 PDF解析の流れ 今回のスクリプトは複数日対応にしていません。 Python:PDFMinerで解析し、CSV保存するスクリプト。 【Python:東京証券取引所日報からテキスト抽出で使ったライブラリ】この記事では、ネット上にPDF形式である「東京証券取引所日報」からテキスト抽出する作業を、Python+PDFMinerでおこなったことをとりあげます。最後にPythonスクリプトを載せました。</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fpagetaka.hatenablog.jp%2Fentry%2F2025%2F02%2F03%2F202640&quot; title=&quot;Python:PDFMiner使い、東京証券取引所日報からテキスト抽出・CSV保存 - pagetakaBlog&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>https://cdn-ak.f.st-hatena.com/images/fotolife/P/PageTAKA/20250203/20250203195059.gif</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2025-02-03 20:26:40</published>
  <title>Python:PDFMiner使い、東京証券取引所日報からテキスト抽出・CSV保存</title>
  <type>rich</type>
  <url>https://pagetaka.hatenablog.jp/entry/2025/02/03/202640</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
