CPAN Authorを数える
なんとなく気になった。
#!perl use strict; use warnings; use Furl; use IO::Uncompress::Gunzip; my $url = 'http://ftp.nara.wide.ad.jp/pub/CPAN/authors/01mailrc.txt.gz'; my $ua = Furl->new; my $res = $ua->get($url); unless ($res->is_success) { die "Can't download $url"; } open my $fh, "<", \$res->content or die "Can't open content"; my $z = IO::Uncompress::Gunzip->new($fh); my ($count, $censored) = (0, 0); while (my $author = $z->getline) { $count++; $censored++ if $author =~ m{<CENSORED>}; } close $fh; printf "CPAN Author %d, CENSORED %d\n", $count, $censored;
結果
% perl author.pl CPAN Author 9038, CENSORED 1756
9000人もいるのか。よくわからんけど、CENSOREDとなっている人も
2割近くいる。検閲・削除なんて意味があるみたいだけど、全く見れないわけではない。