ブログ

たけまる / nlp


2007-07-05 Thu

_ Perl - Text::MeCab を使ってみた [perl][nlp]

MoSQL をインストールしたついでに,MeCab を Perl から使えるようにし
てみました.MeCab は日本語の形態素解析を行うツールで,文章を単語に
区切り,品詞名を推定してくれます.たとえば,文章から固有名詞を抜き
出したり,読み仮名をふるときに使えます.

MeCab と Text::MeCab というふたつのモジュールがありますが,インタ
フェースと速度の面で Text::MeCab が優れているようです.

Text::MeCab を使って,わかち書きと品詞推定をやってみました.品詞情
報をハッシュキーで指定できるように,ちょっと工夫してあります
(ex. $word->{'品詞'} で品詞名,$word->{'読み'} で読み方を得られる).

MeCab のインストールについては "MoSQL を使ってみた" [2007-07-04-1]
を参考にしてください.

続きを読む