Universal Feed Parser

昨日の例でも使用した Universal Feed Parser は非常に便利。何かしらフィードを処理する場合は,とりあえずこいつに突っ込んでおけばなんとかなる。

例えば,ここの RSS フィードを取得するには下のようにする。

import feedparser
feed = feedparser.parse('http://d.hatena.ne.jp/KZR/rss')

エントリーのタイトルを列挙するには,こんな感じ。

for entry in feed.entries: print entry.title

アクセスの方法は RSS でも Atom でも同じでいい。 feedparser が正規化して扱ってくれる。

ただし, Google App Engine で使用する場合は URL 直接指定は使えない模様(sandbox の制限のため?)。 urlfetch を使って取得してから feedparser に食わせた方がいいらしい。