HR領域の単語ベクトル 目次 概要 ダウンロード 単語ベクトルの使い方 概要 「HR領域のワードベクトル」は、株式会社ビズリーチが提供する求人検索エンジン「スタンバイ」の求人データの一部を用いて学習したワードベクトルです。 word2vecの手法で生成した100次元、200次元のデータセットを提供します。 単語ベクトル 学習求人情報数: 2,769,416 学習単語数: 約9.95億 単語ベクトル数: 173,134 データフォーマット: Cバイナリフォーマット(gensim) 学習パラメータ 学習モデル: skip-gram 単語分割: MeCab 辞書: mecab-ipadic-neologd ベクトルサイズ(size): 100/200 反復回数(-iter): 15 単語最低出現回数(min_count): 10 文脈長(window): 2 負例サンプリング (negative