はじめに 以下の記事で映画レビューを収集したとき、ファイル名を作成するために漢字ひらがなカタカナをローマ字に変換できるpykakasiをつかいました。 crimnut.hateblo.jp 今回はそのpykakasiのインストールおよび使い方について説明します。 pykakasiとは pykakasiは、漢字かなまじりの文をひらがな文やローマ字文に変換するライブラリであるKAKASIをPythonで実装したパッケージです。 github.com pykakasiのインストール pykakasiは、sixとsemidbmに依存しているため、これらをインストールします。 pip install six semidbm pykakasiをインストールします。 pip install pykakasi pykakasiの使い方 サンプルコード from pykakasi import kakasi

