Web::Scraper - めざましテレビ・今日の占い

めざましテレビ占いをスクレイプするプログラムを書いた。

#!/usr/bin/env perl

use strict;
use Web::Scraper;
use URI;
use Data::Dumper;
use utf8;
use Encode;

my $baseurl = "http://www.fujitv.co.jp/meza/uranai/index.html";

my $scraper = scraper {
    process "table[background=~/rank/]",'items[]'=> scraper {
	process 'img[src=~/conste_/]', 'title'=>'@alt'; 
	process 'td[class="lucky"]','lucky'=>'TEXT';
	process 'td[class="text"]','text'=>'TEXT';
    };
};
my $res = $scraper->scrape(new URI($baseurl));

my $count = 1;
my @items = @{$res->{items}};
for my $item (@items){
    print $count.": ".encode('utf-8',$item->{"title"})."\n";
    print encode('utf-8',$item->{"text"})."\n";
    print encode('utf-8',$item->{"lucky"})."\n\n";
    $count++;
}

1;

実行結果

1: おうし座
勘がさえここ一番で才能を発揮。断念していた計画に希望の光が。勢いに乗って何事も強気にGO。
休日の予定をたてる

2: やぎ座
...以下、省略

Web::Scraper 便利すぎ。


ref:

use Web::Scraper; - 今日のCPANモジュール(跡地)
404 Not Found - ゆーすけべー日記