TD;LR mecab標準のフォーマットは少し扱いづらい 出力フォーマットを弄ろう! 表層系+品詞の組み合わせができるようになり幸せ mecabのデフォルトの出力形式は使いづらくないですか? 前回の投稿の複数の形態素解析を一度に見るコマンドを作った話に引き続き, 形態素解析器の利用に関するtipsです. 形態素解析と言えば, mecabを使われている方が非常に多いかと思います. 企業利用だと, 製品への組み込みやすさから kuromojiを使ってる方も多いでしょうか? kuromojiを使ったことはないですが mecabを使っていて思うことは, "標準の出力形式扱いづらくない?"ということです. よく利用するのは, 僕は__単語分割(分かち書き)と__品詞取得, __活用形の原形化__ぐらいなものなのですが 標準の出力形式だと, どうしても後段の処理で扱いづらいです. ある問題に対する分析