日本語の文章を、検索用のデータにしたり、機械学習などする際に必須になる分かち書き。 これまではMecabを使ってたけど、インストールが必要になり、辞書も変えたりすると結構大変。 そこで、Google Cloud Natural Language APIを使ってみることにした。 cloud.google.com 環境はプロトタイプ作りにも便利なJupyter+Python3.6をDockerを使って社内サーバーで動かして使っている。 一つなのでdocker-composeは使っていない。 Dockerfile ROM jupyter/notebook RUN pip install --upgrade -q \ pip \ datalab RUN pip install --upgrade google-cloud-language ENV GOOGLE_APPLICATION_CREDEN