HTMLから本文を抜き出せるモジュールHTML::ExtractContentを試してみた

[参考]

とりあえずとれた。

# perl extract.pl "http://anond.hatelabo.jp/20081101232133"                                    
Wide character in print at extract.pl line 16.
■彼女いない歴=年齢 
飲み会で「彼女いない歴=年齢」というのが同僚にバレて、
散々に笑いものにされた。
そしたら、ひとりが
「告って、いったんOKもらって、振られれば彼女いない歴リセットされるやん!!」
とか言って、
振られるの前提かよ、とか思いつつも、なるほど、と納得してしまった。
で、酒の勢いもあって、前から少し気になってた子に、
「事務机に向かう姿に心打たれました、好きです ! 」
なんて冗談で告ったんだ。
そしたら、その子も乗ってくれて、
「私も、前から好きでした。」
なんて言って、周りは大盛り上り。
で、さあ振られようかって時に、その子が、
「や、振らんよ。私は好きやもん。」とケロっと言ったんで、
ビール吹いた。
んでまた周りは大盛り上り。
なんだかんだあって、その子が今の嫁。
のろけでごめんけど、人生どこでどうなるか分からんから、
非モテとかいってても、きっとどうにかなると思うんだ。
がんばれ。%    

Rubyにはこういうライブラリはないのかな。