WWW:Mixi::Scraper::Plugin::RecentEchoでリプライ先を取る
ひさびさにWeb::Scraperを触るのにXPath触ったんだけど、全然覚えてなくて笑えたよ。
で、何をやったかって言うとid:yappoが書いたWWW:Mixi::Scraper::Plugin::RecentEchoに誰あてのリプライなのかわかるように拡張しました。
process '//td[@class="comment"]//a[starts-with(@href, "list_echo.pl")]', reply_name => [ 'HTML', sub { (/>>(.+)/)[0] } ]; process '//td[@class="comment"]//a[starts-with(@href, "list_echo.pl")]', reply_id => [ '@href', sub { (/list_echo.pl\?id=(\d+)\&/)[0] } ];
っていう二行を追加しただけ。
要はlist_echo.plで始まるhref要素を持ったaタグをほげほげしてねって感じです。