エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【備忘録】Doc2vecでWikipediaのデータを使えるようにする準備手順 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【備忘録】Doc2vecでWikipediaのデータを使えるようにする準備手順 - Qiita
最近、研究でDoc2vecに手を出しはじめたのですが、Wikipediaのデータで学習モデルを作る段階でいろいろ... 最近、研究でDoc2vecに手を出しはじめたのですが、Wikipediaのデータで学習モデルを作る段階でいろいろつまづいて悲しい思いをしたので(最終的にはなんとかなったものの)、2度とこのような思いをしないためのメモです。 ちなみにこれが初投稿なので、変なところがあったらすみません。 ■ 主な内容 Wikipediaからダンプデータをダウンロードする bundleを使ってwp2txtをインストール rbenvを用いたruby2.3.0のインストール wp2txtを使ってダンプデータを使える状態にする 自分がやった流れは簡単に言うと以上です。 しかし、最後の方に色々あって、結局どの手順が最適解なのかがわからなくなってしまったので、あまり他の人の参考にはならないかもしれません。 特に、途中のbundleを使ったwp2txtのインストールが結果的に意味があったのかわかりません。 先にruby2.