読者です 読者をやめる 読者になる 読者になる

痛いニュースのインデックス作成

perl xml rss


XML::RSSを使って痛いニュースのタイトルだけ抽出しようかと思ったけど、
無理だった。RSSってバージョンが違ったらいろいろと違うのかな。勉強不足で
よくわかりませんが。


結局、正規表現で作ってしまった。
RSSのバージョンの違いを勉強しよう。

#!/usr/bin/perl
use strict;
use warnings;

use LWP::UserAgent;
use encoding 'utf-8';

my $rss_url = 'http://blog.livedoor.jp/dqnplus/atom.xml';
my $browser = LWP::UserAgent->new();
$browser->agent('Windows IE 7');

my $response = $browser->get($rss_url);
die "Failed download rss!!\n" if !$response->is_success;

my $count = 0;
open my $DQN, "<", \$response->content;
while(my $line = <$DQN>){
    next if $line !~ m/^<(title|modified)/;
    $count++;

    my $tagname = $1;
    $line =~ s!</?$tagname>!!g;

    print $line;
    print "\n" if $count % 2 == 0;
    last if $count == 10;
}
close $DQN;

適当すぎですね。もう少しまともなものを書こう。