エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Word2vecでコーパスを変えたときの出力比較(位置情報関連) - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Word2vecでコーパスを変えたときの出力比較(位置情報関連) - Qiita
自然言語処理 Advent Calendar 2017の記事です。 Word2vecは目的に合わせたコーパス選びが重要だと思い... 自然言語処理 Advent Calendar 2017の記事です。 Word2vecは目的に合わせたコーパス選びが重要だと思います。この記事ではコーパスを変えたときに出力がどう変わるかという一例を紹介します。私がTwitterの位置情報関連の研究しているので、施設名を入力にしたときの出力の違いを見てみます。 今回は、 Word2vecの産みの親Mikolovさんが作ったツールで学習させます。論文公開当初はGoogle Codeにありましたが、Google Codeのサービス終了に伴い、今はGithubにコードがあります。 https://github.com/svn2github/word2vec Mecabなどで日本語を分かち書きしたテキストファイルを用意して、以下のコマンドで学習します。 ./word2vec -train 分かち書きしたテキストファイル名 -output Word2v