2010-03-01から1ヶ月間の記事一覧

AV女優の情報をデータベースに突っ込む

データベースを扱うプログラムの例として, DMM.comからAV女優の 情報を取得して、データベースに突っ込むというコードを書いてみた。 #!/usr/bin/env perl use strict; use warnings; use utf8; use Web::Scraper; use URI; use Time::HiRes; use DBI; binmo…

ブログの更新頻度確認プログラム

RSSからブログの更新概要を取得するということをしたいのですが、 そのブログがあまりに更新されていないのであれば、対象から外したい。 単純に最新のエントリの更新時刻と現在時刻を比較するっていうのも ありますけど、最新とその前のエントリの更新がど…

時刻の計算

ブログがどの程度の頻度で更新されているかを調べるのに 少し調べてみた。二つの記事の更新日時を取得して差分を 求めれば、どれぐらい更新されていないかがわかるはず DateTimeオブジェクトは演算子のオーバロードを行っており、 イメージに近い感じで日付…

RFC822形式の日付形式の解析

RSSの更新日時の形式として ISO8601と RFC822形式が見られますが、 後者の方の解析がよくわからなかったので調べてみた。 CPANを探したところいくつかモジュールが見つかったんで とりあえず DateTime名前空間にある DateTime::Format::Mailと いうモジュー…

Google APIで天気を取得

Google API から天気の取得 - みずぴー日記 を見て Perlで書いて みました。 #!/usr/bin/env perl use strict; use warnings; use XML::LibXML; use LWP::Simple; binmode STDOUT, ":utf8"; my $region = shift @ARGV or die "usage google_weather.pl regio…

RSS, Atomの URLを探す

RSS, ATOMを探すのを自前で書いていたけど、Feed::Findという モジュールがありました。RSS、Atom対応しているサイトが <link rel='alternate'... />というタグだったらいいんですけど、そうじゃないサイトもあるので 自前で書いてました。ソースを確認したところ、結局自前で書いている</link>…

WebScraperのフィルター機能

Web::Scraperのソースコードを見ていると、processの引数に無名配列を 与えると、得られた値にフィルターに通すことができることがわかった。 perldocにも書いていないっぽいので自分で書いてみた。 Yahooの AV女優のブログカテゴリから 名前と URLを取得す…