これで準備完了 いよいよpythonで形態素解析 今回は品詞を取得します 適当に一文だけ試してもよいのですが、せっかく形態素解析するなら文章のほうがいいってことで青空文庫から適当にデータをとってきます 今回は太宰治「人間失格」にしてみました https://www.aozora.gr.jp/cards/000035/card301.html 上記リンクからテキストファイル(ルビあり)をダウンロードし、ningen_shikkaku.txtを以下のtest.pyと同じディレクトリに保存してください import Mecab import re bindata = open('ningen_shikkaku.txt', 'rb').read() textdata = bindata.decode('shift_jis') # 青空文庫のための固有処理 textdata = re.split(r