2008-11-02から1日間の記事一覧

HTMLから本文を抜き出せるモジュールHTML::ExtractContentを試してみた

[参考] HTMLから本文を抜き出せるモジュールHTML::ExtractContent HTML::ContentExtractor + Lingua::JA::Summarize::Extract CPANモジュールのインストール とりあえずとれた。 # perl extract.pl "http://anond.hatelabo.jp/20081101232133" Wide characte…