MeCabで形態素解析せずに分かち書きだけを行う

カテゴリ: MeCab, python

MeCabで形態素解析を行わず、分かち書きだけ行いたい場合は、-Owakatiオプションを使用すれば良いです。

まずは下記の内容でファイルinput.txtを用意しておきます

すもももももももものうち

その後、以下のように-OwakatiオプションでMeCabを実行すれば、それぞれの語がスペース区切りで分かち書きされます。

cat input.txt | mecab -Owakati
すもも も もも も もも の うち

複数行のファイルも問題ないです。

$ cat input.txt
すもももももももものうち
今日はいい天気です

cat input.txt | mecab -Owakati
すもも も もも も もも の うち
今日 は いい 天気 です

pythonのスクリプトで分かち書きする場合

pythonスクリプトから同様のことを行いたい場合は、Tagger()メソッドの引数にオプションを指定します。

import sys
import MeCab

m = MeCab.Tagger ("-Owakati")
print(m.parse ("すもももももももものうち"))

実行結果は下記の通りです。

$ python test01.py
すもも も もも も もも の うち
こちらもおススメ

コメントを残す

メールアドレスが公開されることはありません。