ふそうごむ。by扶桑ゴム産業

扶桑ゴム産業の最新情報とうぇぶますたあ「TKYK」の個人的日記。

ちょっとだけMeCabチューン

とりあえずインストールしていたMeCabだったが、バグ?もありありで、なんか意欲が失せていたのだが、最近0.94にバージョンアップして、各種バグFixも行なわれたようなので、早速ユーザー辞書をいじってみた。
context_id.cpp(88) [it != left_.end()] cannot find LEFT-ID for 名詞,固有名詞,一般,*,*,*,*
みたいな表示も出て、またかー!と思ったけど、なんとか切り抜けた。
nkf --utf8 left-id.def > left-id.1 rm left-id.def mv left-id.1 left-id.def
みたいな感じで{left|right}-id.defの文字コードを合わせてやることと、品詞の指定を正しいものにしておくこと。(文字コードの件は間違ってるかも、自信なし)
# /usr/local/libexec/mecab/mecab-dict-index ¥ -d/usr/local/lib/mecab/dic/ipadic -u user.dic -f utf8 -t utf8 user.csv reading user.csv ... 3 emitting double-array: 100% |###################################| done!
ちょっとだけ、切り分けが賢くなった! これで、「ネオロン」が「ネオ ロン」というマヌケな結果にならないですみます[:楽しい:]