読者です 読者をやめる 読者になる 読者になる

俺用サービス::ブログの巡回と報告(Python)

はてブから巡回URLを取り込み、訪問し、RSSフィードなどを読んで、各サイトの最近の更新を一覧にして、メールで俺に報告してくれ。


・俺はてブで"巡回"っていうタグを付けたURLを取り込む⇒一覧にする
・列挙されたURLを順、または並列に訪問して、RSSフィードの位置を調べる(大抵HTML中に記載がある)
RSSフィードを見つけたら、XML解析処理(MagpieRSS的な)して、記事の日付・タイトル・概要を取得する。これを記事更新データとする。
・各サイトの記事更新データを併合して、日付で並び替える。これを併合記事更新データとする。
・併合記事更新データから、過去24時間以内の記事日付のデータを取り出す。これを直近記事更新データとする。
・直近記事更新データを、メールに成形して、俺に送る。