Pythonでスクレイピング 1-3,1-4/CSSセレクタ,再帰処理でリンク先を丸ごとダウンロード

saguh https://blog.hatena.ne.jp/saguh/ 塩見周子の徒然日記 https://tooh.hatenadiary.jp/ Pythonによるスクレイピング&機械学習 1-3DOM（Document Object Model）の話。正直HTMLとの違いがわかりません......。DOMの要素を引っ張ってくる為の話をしてました。ブラウザを利用したセレクタの利用例（青空文庫で公開されている夏目漱石の作品一覧を取得するプログラム）1:「ページのソースを表示」をクリック 2:「要素」をクリック→選択した部分の上で「要素の詳細を表示」をクリック 3:要素のCSSセレクタをコピーこのようにして得られたCSSセレクタの値は body > ol:nth-child(8) > li:nth-child(1) となる。これは、「HTMLで上から辿っていくと、＜body＞→8番… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftooh.hatenadiary.jp%2Fentry%2F2019%2F09%2F17%2F042023" title="Pythonでスクレイピング 1-3,1-4/CSSセレクタ,再帰処理でリンク先を丸ごとダウンロード - 塩見周子の徒然日記" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/s/saguh/20190917/20190917040750.png Hatena Blog https://hatena.blog 2019-09-17 04:20:23 Pythonでスクレイピング 1-3,1-4/CSSセレクタ,再帰処理でリンク先を丸ごとダウンロード rich https://tooh.hatenadiary.jp/entry/2019/09/17/042023 1.0 100%