macOSにmecab-ipadic-NEologdをインストールしたので、インストール時の手順を書いておきます。
デフォルト設定だと、インストールした辞書は/usr/local/lib/mecab/dic/mecab-ipadic-neologd/以下に作成されます。
## 実行した環境
今回のインス...
MeCabの記事一覧

mecab-ipadic-NEologdのインストールでエラー「unxz is not found.」が出た時
2018年5月26日
| カテゴリ: MeCab
mecabの辞書であるmecab-ipadic-NEologdをインストールする時「unxz is not found.」がエラーが発生してインストールが失敗する場合があります。
## エラーの出力例
```language-bash
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic...
macOS上でpythonからmecab-python3をインストールしようとしたら、エラー「mecab-config: command not found」が発生した
## 発生した事象と、解決の手順
まず、brewでmecabとmecab-ipadicをインストールする
```language-bash
brew install mecab...
pythonでMeCabの分かち書き機能を利用して、特定のファイル内に存在する単語の出現回数を求めるプログラムです。
単語の出現回数を求めることは、自然言語処理の中ではtf(term frequency)と呼ばれています。
## プログラム
```language-python
# tf....
ファイルから読み込むと末尾に改行文字が付くので、改行を取り除く必要がある点に注意。
## プログラム
```language-python
import sys
import MeCab
m = MeCab.Tagger ("-Owakati")
for line in open('input.txt', 'r'):
words = m.par...

[NLP]夏目漱石の「ぼっちゃん」の本文を非対話で取得しMeCabで処理する
2018年5月5日
| カテゴリ: MeCab
MeCabで自然言語処理のプログラムを書いて見ようとした場合、処理させる対象のテキストデータが必要となります。そこで今回は、サンプルのテキストとして青空文庫から夏目漱石の「ぼっちゃん」をダウンロードし、MeCabで操作してみました。
## 青空文庫...
AmazonLinuxで、Python3から形態素解析ライブラリのMeCabを使用できるようセットアップしたVagrantの設定ファイルを作成しました。
下記の内容をVagrantfileの名前で保存し、vagrantが入った環境で`vagrant up`するだけで環境が構築できます。
[関連...
MeCabで形態素解析を行わず、分かち書きだけ行いたい場合は、`-Owakati`オプションを使用すれば良いです。
まずは下記の内容でファイルinput.txtを用意しておきます
```language-bash
すもももももももものうち
```
その後、以下のように`-Owakat...
pythonでMeCabを使おうとしたところ、いろいとエラーがでてハマったので、発生したエラーと対処した方法を書いておきます。
## 作ったプログラム
今回動作させようとしたプログラムは下記で、与えられた文章の形態素解析を行うものです。
```language...

[NLP]VagrantでAmazonLinuxにMeCabをインストールする
2018年5月3日
| カテゴリ: MeCab
AmazonLinuxにMeCabをインストールすることがあったので、その時の手順をVagrantfileにしたものを公開しておきます。
Vagrantを使わずに、手作業でセットアップしたい場合は`config.vm.provision`に書いてあるコマンドを手で実行すれば良いです。
...
## 発生した事象
MeCabの辞書であるmecab-ipadicをインストールしようとしてconfigureしたところ、下記のエラーが発生した
```language-bash
configure: error: mecab-config is not found in your system
```
## 環境
```language-bash
Amazon L...