小ネタです。 表題の通り、日本語の特徴ベクトルを5秒で作れると嬉しいなと思ってまとめてみました。 成果物 https://github.com/osuossu8/Utils/blob/master/text_preprocess/bert_sentence_vectorizer.py 参考にさせていただいたページ huggingface/transformers の日本語BERTで文書分類器を作成する - Qiita コサイン類似度行列?それNumPyですぐ出せるよ - Qiita https://jp.quora.com/BERT-wo-shiyou-shi-te-bunshou-no-ruiji-do-wo-sanshutsu-suru-ni-ha-dono-you-na-tejun-ga-hitsuyou-desu-ka How to use サンプルとして以下の文章群について適用し