はじめに テキストデータの前処理や可視化を簡単に行うことができるTextheroを使ってみたので、使い方をまとめました。 目次 はじめに 目次 Textheroとは Textheroの使い方 前処理 可視化 データの準備 word cloud 散布図 注釈 参考文献 Textheroとは 「texthero(テキストヒーロー)」とは、テキストデータの前処理やベクトル化、表現および可視化を行うことができるオープンソースのライブラリです。 非常に新しいライブラリで、現在β版としてリリースされています(2021/03/09時点)。 Pythonによる数行の簡単な実装で、様々な自然言語処理のタスクを行うことが可能です。 今回は、使い方を学ぶという目的で、英語を対象にテキスト解析してみます。 ※公式ページによると、今後日本語をはじめ多言語に対応予定とのことです。 Textheroの使い方 ※以下、言