毎日、企業は大量の非構造化テキストを扱っています。電子メールでの顧客とのやり取りから、オンラインのフィードバックやレビューまで。この大量のテキストを処理するために、トピックモデリングに目を向けます。繰り返し発生するトピックを特定することにより、ドキュメントから自動的に意味を抽出する手法。 数ヶ月前、トピックモデリングにBERTを活用することに関する記事を書きました。思いがけず爆発し、ポジティブなフィードバックに驚きました! 私は、記事の基になっているトピックモデリング手法であるBERTopicをさらに開発することに焦点を当てることにしました。 BERTopic は、BERT埋め込みとクラスベースのTF-IDFを活用して密集したクラスターを作成するトピックモデリング手法であり、トピックの説明に重要な単語を残しながら、簡単に解釈できるトピックを可能にします。 私は今、BERTopicが十分な牽
![BERTopicを使用したインタラクティブトピックモデリング](https://cdn-ak-scissors.b.st-hatena.com/image/square/d313491ef7a2600df9b97340c39ba451d2aeb1e8/height=288;version=1;width=512/https%3A%2F%2Fichi.pro%2Fassets%2Fimages%2Fmax%2F724%2F1%2ATCRaoLgM55UR94Qi1L-6YA.gif)