PythonでXMLの要素を抜き出す[RSSからでしょ編]

hirothin https://blog.hatena.ne.jp/hirothin/ while( life != end ){ do( enjoy ); } https://hirothin.hatenadiary.org/ Python PythonでXMLの要素を抜き出すこのアプローチでは問題があることに気付いた！RSS配信されているニュースは、そのXMLをパースして処理した方が確実で効率的。いちいちニュースサイトのレイアウト解析して、ニュースのリンクのみ抜き出して・・って時代じゃないよね。-; ということで再チャレンジ！新アプローチ手順１．RSSリンクからXMLをminidomに食わせる２．あとは前回の方法で、必要なデータを抽出する。 [ Sample.py ]import urllib2 import sys from xml.dom import minidom, Node#今回追加した関数 def urlP… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fhirothin.hatenadiary.org%2Fentry%2F20080730%2F1217407065" title="PythonでXMLの要素を抜き出す[RSSからでしょ編] - while( life != end ){ do( enjoy ); }" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2008-07-30 17:37:45 PythonでXMLの要素を抜き出す[RSSからでしょ編] rich https://hirothin.hatenadiary.org/entry/20080730/1217407065 1.0 100%