macOSにmecab-ipadic-NEologdをインストールしたので、インストール時の手順を書いておきます。
デフォルト設定だと、インストールした辞書は/usr/local/lib/mecab/dic/mecab-ipadic-neologd/以下に作成されます。
実行した環境
今回のインストールは、以下の環境で実行しています。
$ sw_vers
ProductName: Mac OS X
ProductVersion: 10.13.4
BuildVersion: 17E202
$ mecab --version
mecab of 0.996
$ mecab-config --dicdir
/usr/local/lib/mecab/dic
インストールに必要なパッケージを取得
インストールの途中でxzコマンドが要求されるので、あらかじめインストールしておきます。
brew install xz
ipadic-neologdを取得
ipadic-neologdはgithubで管理されているのでcloneして取得します。
実際のインストールは別の場所になるので、作業するディレクトリは適当な場所でOKです。
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
インストール
インストールは、bin/install-mecab-ipadic-neologdコマンドで行います。
また、インストールの途中で"Do you want to install mecab-ipadic-NEologd? Type yes or no."と聞かれるのでyesとタイプする必要があります。
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n
[install-mecab-ipadic-NEologd] : Start..
[install-mecab-ipadic-NEologd] : Check the existance of libraries
[install-mecab-ipadic-NEologd] : find => ok
[install-mecab-ipadic-NEologd] : sort => ok
[install-mecab-ipadic-NEologd] : head => ok
[install-mecab-ipadic-NEologd] : cut => ok
[install-mecab-ipadic-NEologd] : egrep => ok
[install-mecab-ipadic-NEologd] : mecab => ok
[install-mecab-ipadic-NEologd] : mecab-config => ok
[install-mecab-ipadic-NEologd] : make => ok
[install-mecab-ipadic-NEologd] : curl => ok
[install-mecab-ipadic-NEologd] : sed => ok
[install-mecab-ipadic-NEologd] : cat => ok
[install-mecab-ipadic-NEologd] : diff => ok
[install-mecab-ipadic-NEologd] : tar => ok
[install-mecab-ipadic-NEologd] : unxz => ok
[install-mecab-ipadic-NEologd] : xargs => ok
[install-mecab-ipadic-NEologd] : grep => ok
[install-mecab-ipadic-NEologd] : iconv => ok
[install-mecab-ipadic-NEologd] : patch => ok
[install-mecab-ipadic-NEologd] : which => ok
[install-mecab-ipadic-NEologd] : file => ok
[install-mecab-ipadic-NEologd] : openssl => ok
[install-mecab-ipadic-NEologd] : awk => ok
[install-mecab-ipadic-NEologd] : mecab-ipadic-NEologd is already up-to-date
[install-mecab-ipadic-NEologd] : mecab-ipadic-NEologd will be install to /usr/local/lib/mecab/dic/mecab-ipadic-neologd
[install-mecab-ipadic-NEologd] : Make mecab-ipadic-NEologd
[make-mecab-ipadic-NEologd] : Start..
...中略...
test-mecab-ipadic-NEologd] : Please check difference between default system dictionary and mecab-ipadic-NEologd
default system dictionary | mecab-ipadic-NEologd
荒川 静香 | 荒川静香
訴求 力 | 訴求力
サラリーマン 川柳 | サラリーマン川柳
GR 8 EST | GR8EST
プライズフェア | プライズ フェア
戸村 健次 | 戸村健次
地熱 発電 所 | 地熱発電所
貝 毒 | 貝毒
キムラ 緑子 | キムラ緑子
京都大 作戦 | 京都大作戦
はやり 目 | はやり目
原 監督 | 原監督
鑑定 留置 | 鑑定留置
東尾 張 病院 | 東尾張病院
サラリーマン 川柳 コンクール | サラリーマン川柳 コンクール
[test-mecab-ipadic-NEologd] : Finish..
[install-mecab-ipadic-NEologd] : Please check the list of differences in the upper part.
[install-mecab-ipadic-NEologd] : Do you want to install mecab-ipadic-NEologd? Type yes or no.
yes
[install-mecab-ipadic-NEologd] : OK. Let's install mecab-ipadic-NEologd.
[install-mecab-ipadic-NEologd] : Start..
[install-mecab-ipadic-NEologd] : /usr/local/lib/mecab/dic is current user's directory
[install-mecab-ipadic-NEologd] : Make install to /usr/local/lib/mecab/dic/mecab-ipadic-neologd
make[1]: Nothing to be done for `install-exec-am'.
/bin/sh ./mkinstalldirs /usr/local/lib/mecab/dic/mecab-ipadic-neologd
mkdir /usr/local/lib/mecab/dic/mecab-ipadic-neologd
/usr/bin/install -c -m 644 ./matrix.bin /usr/local/lib/mecab/dic/mecab-ipadic-neologd/matrix.bin
/usr/bin/install -c -m 644 ./char.bin /usr/local/lib/mecab/dic/mecab-ipadic-neologd/char.bin
/usr/bin/install -c -m 644 ./sys.dic /usr/local/lib/mecab/dic/mecab-ipadic-neologd/sys.dic
/usr/bin/install -c -m 644 ./unk.dic /usr/local/lib/mecab/dic/mecab-ipadic-neologd/unk.dic
/usr/bin/install -c -m 644 ./left-id.def /usr/local/lib/mecab/dic/mecab-ipadic-neologd/left-id.def
/usr/bin/install -c -m 644 ./right-id.def /usr/local/lib/mecab/dic/mecab-ipadic-neologd/right-id.def
/usr/bin/install -c -m 644 ./rewrite.def /usr/local/lib/mecab/dic/mecab-ipadic-neologd/rewrite.def
/usr/bin/install -c -m 644 ./pos-id.def /usr/local/lib/mecab/dic/mecab-ipadic-neologd/pos-id.def
/usr/bin/install -c -m 644 ./dicrc /usr/local/lib/mecab/dic/mecab-ipadic-neologd/dicrc
[install-mecab-ipadic-NEologd] : Install completed.
[install-mecab-ipadic-NEologd] : When you use MeCab, you can set '/usr/local/lib/mecab/dic/mecab-ipadic-neologd' as a value of '-d' option of MeCab.
[install-mecab-ipadic-NEologd] : Usage of mecab-ipadic-NEologd is here.
Usage:
$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd ...
[install-mecab-ipadic-NEologd] : Finish..
[install-mecab-ipadic-NEologd] : Finish..
インストール先ディレクトリは、ログの以下の部分から確認できます
このディレクトリは、mecab-config --dicdir
の結果を元に判断しているようです。
[install-mecab-ipadic-NEologd] : /usr/local/lib/mecab/dic is current user's directory
[install-mecab-ipadic-NEologd] : Make install to /usr/local/lib/mecab/dic/mecab-ipadic-neologd
インストールされた辞書の確認
先ほど確認したインストール先をfindしてみると、確かに/usr/local/lib/mecab/dic/mecab-ipadic-neologdの下に、ファイルがいくつか作成されています。
$ find `mecab-config --dicdir`
/usr/local/lib/mecab/dic
/usr/local/lib/mecab/dic/mecab-ipadic-neologd
/usr/local/lib/mecab/dic/mecab-ipadic-neologd/rewrite.def
/usr/local/lib/mecab/dic/mecab-ipadic-neologd/left-id.def
/usr/local/lib/mecab/dic/mecab-ipadic-neologd/pos-id.def
/usr/local/lib/mecab/dic/mecab-ipadic-neologd/matrix.bin
/usr/local/lib/mecab/dic/mecab-ipadic-neologd/unk.dic
/usr/local/lib/mecab/dic/mecab-ipadic-neologd/sys.dic
/usr/local/lib/mecab/dic/mecab-ipadic-neologd/dicrc
/usr/local/lib/mecab/dic/mecab-ipadic-neologd/right-id.def
/usr/local/lib/mecab/dic/mecab-ipadic-neologd/char.bin
/usr/local/lib/mecab/dic/ipadic
/usr/local/lib/mecab/dic/ipadic/rewrite.def
/usr/local/lib/mecab/dic/ipadic/left-id.def
/usr/local/lib/mecab/dic/ipadic/pos-id.def
/usr/local/lib/mecab/dic/ipadic/matrix.bin
/usr/local/lib/mecab/dic/ipadic/unk.dic
/usr/local/lib/mecab/dic/ipadic/sys.dic
/usr/local/lib/mecab/dic/ipadic/dicrc
/usr/local/lib/mecab/dic/ipadic/right-id.def
/usr/local/lib/mecab/dic/ipadic/char.bin
辞書を変えて結果を比較する
mecabでは辞書の指定を"-d"で行えます。試しに辞書を切り替えながら、分かち書きの結果が変わるかチェックを行ってみます。
mecab標準の辞書
$ echo サラリーマン川柳 コンクール | mecab
サラリーマン 名詞,一般,*,*,*,*,サラリーマン,サラリーマン,サラリーマン
川柳 名詞,一般,*,*,*,*,川柳,センリュウ,センリュー
コンクール 名詞,一般,*,*,*,*,コンクール,コンクール,コンクール
EOS
ipadic-neologdを使用
$ echo サラリーマン川柳 コンクール | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/
サラリーマン川柳 名詞,固有名詞,一般,*,*,*,サラリーマン川柳,サラリーマンセンリュウ,サラリーマンセンリュー
コンクール 名詞,一般,*,*,*,*,コンクール,コンクール,コンクール
EOS
上記の結果より、ipadic-neologdのおかげで"サラリーマン川柳"という固有名詞が正しく分かち書きできていることがわかりました。
こちらもおススメ