エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
SentencePiece・fastTextをEPELのパッケージを使って簡単にインストールできるようになります - 2019-10-17 - ククログ
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
SentencePiece・fastTextをEPELのパッケージを使って簡単にインストールできるようになります - 2019-10-17 - ククログ
はじめに SentencePieceは、言語に依存することなく学習データから文章をトークナイズすることができる... はじめに SentencePieceは、言語に依存することなく学習データから文章をトークナイズすることができるものです。 MeCabでは言語に依存した辞書が必要でしたが、SentencePieceは言語非依存なので、辞書が不要になります。 SentencePieceについて詳しくは開発者による記事があるのでそちらを参照されると理解がより深まるでしょう。 Sentencepiece : ニューラル言語処理向けトークナイザ 一方のfastTextは文書から学習してテキストを分類し、類似する単語を単語の類似度を計算することができます。 類似度をうまくつかえば、似たような文章をサジェストすることができそうです。 どちらもデータを学習させて活用するためのものですが、SentencePieceやfastTextのことを知って、ちょっと試そうとするにもやや手間が必要でした。これまではソースコードを取得し