エントリーの編集
                エントリーの編集は全ユーザーに共通の機能です。
                    必ずガイドラインを一読の上ご利用ください。
Elastic Stack 8.0 の NLP で日本語センチメント分析を試してみた - 後編 - Qiita
記事へのコメント0件
- 注目コメント
 - 新着コメント
 
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
          - バナー広告なし
 - ミュート機能あり
 - ダークモード搭載
 
関連記事
Elastic Stack 8.0 の NLP で日本語センチメント分析を試してみた - 後編 - Qiita
先日 Elastic Stack 8.0 の NLP で日本語センチメント分析を試してみた を書いたところ、「これ、ちゃん... 先日 Elastic Stack 8.0 の NLP で日本語センチメント分析を試してみた を書いたところ、「これ、ちゃんと日本語で処理できるのかな?中の動きが知りたい」とコメントいただきました。確かに、モデル側では fugashi などを使っているのに Elasticsearch 側では使ってないはずですね。 今回は Elastic Stack 8.0.1 を使って、 inference で判定させるテキストをどうやって tokenize しているかを調査してみました。 勿体ぶらずにまずは結論から。 結論: Elastic Stack 8.0.1 時点では、日本語は Unigram で扱われている 全体の処理の流れを Tokenizer を中心に整理してみました。 学習フェーズ 事前に学習する部分。 BertForSequenceClassification というアーキテクチャの一部で
              
            

