Web ページのデータをクローリングで取得する

junichim https://blog.hatena.ne.jp/junichim/ プログラマーのメモ書き https://blog.mori-soft.com/ python いま、こちらの記事で試している RAG アプリケーションはテキストファイル（json）として与えているデータを元にしています。せっかくなので今後知識として与えるデータを広げていきたいと思います。そのためにまずは Web ページをクローリングして必要なデータをファイルに出力する方法を試してみたので、メモっておきます。 scrapy の基本準備プロジェクトを生成 spider を記述実行応用プロジェクトの設定変更スパイダーの定義方法別の Python ファイルから実行複数のスパイダーを実行対話実行所感 scrapy の基本 Python でクローリング処理を簡単にできないもの… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fblog.mori-soft.com%2Fentry%2F2025%2F09%2F11%2F164420" title="Web ページのデータをクローリングで取得する - プログラマーのメモ書き" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/j/junichim/20250911/20250911152914.png Hatena Blog https://hatena.blog 2025-09-11 16:44:20 Web ページのデータをクローリングで取得する rich https://blog.mori-soft.com/entry/2025/09/11/164420 1.0 100%