pythonでHTMLをパースしてXpathする

takuya_1st https://blog.hatena.ne.jp/takuya_1st/ それマグで！ https://takuya-1st.hatenablog.jp/ python python でも xpath したい。 libxml でパースするには、lxml を使うと楽 pip install lxml 使い方。 lxml.html を使うと確実に、パースする事ができる。parse は IO を取るのでStringIOを使うことになる。 lxml.html.parse(StringIO(page.html)) サンプル import lxml.html from io import StringIO, BytesIO def parse( node , idx ) : name = node.xpath(".//*[@class='desc-title']//tex… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftakuya-1st.hatenablog.jp%2Fentry%2F2017%2F03%2F30%2F013134" title="pythonでHTMLをパースしてXpathする - それマグで！" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2017-03-30 01:31:34 pythonでHTMLをパースしてXpathする rich https://takuya-1st.hatenablog.jp/entry/2017/03/30/013134 1.0 100%