エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
日本語のWikipediaの全文データを使ってWord2vecを訓練する - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
日本語のWikipediaの全文データを使ってWord2vecを訓練する - Qiita
日本語のWikipediaの全文データを使ってWord2vecを訓練する方法についてまとめます。 Udemy【TensorFlow... 日本語のWikipediaの全文データを使ってWord2vecを訓練する方法についてまとめます。 Udemy【TensorFlow・Keras・Python3で学ぶ】時系列データ処理入門(RNN/LSTM, Word2Vec)の内容です。 環境 Ubuntu18.04 データをダウンロード https://dumps.wikimedia.org/jawiki/latest/ からjawiki-latest-pages-articles.xml.bz2をダウンロードし、解凍する。 wp2txtを使って、xmlからテキストファイルを生成する wp2txtはrubyのgemなので、rubyがインストールされているかを確認する。