Web::Scraper - めざましテレビ・今日の占い
めざましテレビ占いをスクレイプするプログラムを書いた。
#!/usr/bin/env perl use strict; use Web::Scraper; use URI; use Data::Dumper; use utf8; use Encode; my $baseurl = "http://www.fujitv.co.jp/meza/uranai/index.html"; my $scraper = scraper { process "table[background=~/rank/]",'items[]'=> scraper { process 'img[src=~/conste_/]', 'title'=>'@alt'; process 'td[class="lucky"]','lucky'=>'TEXT'; process 'td[class="text"]','text'=>'TEXT'; }; }; my $res = $scraper->scrape(new URI($baseurl)); my $count = 1; my @items = @{$res->{items}}; for my $item (@items){ print $count.": ".encode('utf-8',$item->{"title"})."\n"; print encode('utf-8',$item->{"text"})."\n"; print encode('utf-8',$item->{"lucky"})."\n\n"; $count++; } 1;
実行結果
1: おうし座 勘がさえここ一番で才能を発揮。断念していた計画に希望の光が。勢いに乗って何事も強気にGO。 休日の予定をたてる 2: やぎ座 ...以下、省略
Web::Scraper 便利すぎ。
ref:
use Web::Scraper; - 今日のCPANモジュール(跡地)
404 Not Found - ゆーすけべー日記