インストール
# vim /etc/apt/sources.list -> non-freeを追記 # apt-get update # apt-get install mecab libmecab-dev mecab-ipadic-utf8 # vim /etc/apt/sources.list -> non-freeを削除 # apt-get update # cpanm Text::MeCab
正しくインストールされたか確認
ソース
use strict; use utf8; use Text::MeCab; my $text = 'すもももももももものうち'; my @fields = qw(id surface feature length); sub text_mecab { my $mecab = Text::MeCab->new(); for(my $node = $mecab->parse($text); $node; $node = $node->next ) { for my $field (@fields) { print $node->$field(), "\n"; } } } text_mecab();
出力
9 すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ 9 18 も 助詞,係助詞,*,*,*,*,も,モ,モ 3 24 もも 名詞,一般,*,*,*,*,もも,モモ,モモ 6 30 も 助詞,係助詞,*,*,*,*,も,モ,モ 3 36 もも 名詞,一般,*,*,*,*,もも,モモ,モモ 6 45 の 助詞,連体化,*,*,*,*,の,ノ,ノ 3 56 うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ 6 62 BOS/EOS,*,*,*,*,*,*,*,* 0
あとはコードを書くだけ。