Universal Feed Parser
昨日の例でも使用した Universal Feed Parser は非常に便利。何かしらフィードを処理する場合は,とりあえずこいつに突っ込んでおけばなんとかなる。
例えば,ここの RSS フィードを取得するには下のようにする。
import feedparser feed = feedparser.parse('http://d.hatena.ne.jp/KZR/rss')
エントリーのタイトルを列挙するには,こんな感じ。
for entry in feed.entries: print entry.title
アクセスの方法は RSS でも Atom でも同じでいい。 feedparser が正規化して扱ってくれる。
ただし, Google App Engine で使用する場合は URL 直接指定は使えない模様(sandbox の制限のため?)。 urlfetch を使って取得してから feedparser に食わせた方がいいらしい。