ubuntu9.04 で mecab を Python から使うまで。

シェアする

ちょっとbotに機能追加しようかなーなんて思いつきで形態素解析エンジンである Mecab をインストールした。以下のURLの通りにやって途中上手くいかなかったり使うコマンドが違ったりするのでエントリーに起こしておく。

参考にしたのは 白湯の日記(2009-08-20) です。ありがとうございます。

違う箇所は、mecab-python をインストールする際にpecoを使わなかった事。というかbuildする際にg++ だの python-dev が必要な様で、それが俺の鯖に入ってなくて激しくエラーが出た。そこもあわせて以下コマンド羅列。

$ sudo vi /etc/apt/sources.list
  # 以下を追記
  deb http://cl.naist.jp/~eric-n/ubuntu-nlp intrepid all
  deb-src http://cl.naist.jp/~eric-n/ubuntu-nlp intrepid all

$ wget http://cl.naist.jp/~eric-n/ubuntu-nlp/8ABD1965.gpg -O- | sudo apt-key add -
$ sudo apt-get update
$ sudo apt-get install cabocha
$ sudo apt-get install cabocha-dic-utf8
$ sudo apt-get install mecab
$ sudo apt-get install mecab-naist-jdic-utf8
$ sudo apt-get install libmecab-dev
$ wget http://downloads.sourceforge.net/project/mecab/mecab-python/0.97/mecab-python-0.97.tar.gz
$ tar xf mecab-python-0.97.tar.gz
$ cd mecab-python-0.97
$ sudo apt-get install g++
$ sudo apt-get install python-dev
$ python setup.py build
$ sudo python setup.py install
$ python
>>> import MeCab
>>> m = MeCab.Tagger('-Ochasen')
>>> print m.parse("例文スカイプくれ")
例文    レイブン        例文    名詞-一般
スカイプ        スカイプ        スカイプ        名詞-一般
くれ    クレ    くれる  動詞-自立       一段・クレル    連用形
EOS

例文というのは友達の名前でほんとのハンドルネームはReivenというのだけどいろいろあって例文と呼ばれるようになった。うちのクランのIRCチャンネルで「例文スカイプくれ」というともれなくSkypeが飛んできます。

Sponsored Link

シェアする

フォローする