CPAN Authorを数える

なんとなく気になった。

#!perl
use strict;
use warnings;

use Furl;
use IO::Uncompress::Gunzip;

my $url = 'http://ftp.nara.wide.ad.jp/pub/CPAN/authors/01mailrc.txt.gz';
my $ua = Furl->new;

my $res = $ua->get($url);
unless ($res->is_success) {
    die "Can't download $url";
}

open my $fh, "<", \$res->content or die "Can't open content";
my $z = IO::Uncompress::Gunzip->new($fh);

my ($count, $censored) = (0, 0);
while (my $author = $z->getline) {
    $count++;
    $censored++ if $author =~ m{<CENSORED>};
}
close $fh;

printf "CPAN Author %d, CENSORED %d\n", $count, $censored;
結果
  % perl author.pl
  CPAN Author 9038, CENSORED 1756

9000人もいるのか。よくわからんけど、CENSOREDとなっている人も
2割近くいる。検閲・削除なんて意味があるみたいだけど、全く見れないわけではない。