[B! mecab][word2vec] zmsgnkのブックマーク

zmsgnk id:zmsgnk

mecabとword2vecに関するzmsgnkのブックマーク (1)

word2vec ～モデル仕様の詳細調査とモデルのパラメータ設定ケース別意味「類似度」計算結果の比較・考察（①モデル次元数 ②window幅を変えて挙動を確認）～コーパス事例：和文学術論文（西田幾多郎）『善の研究』 - Qiita
まず最初に、word2vec の仕様を ① Mikolov 氏ほか共著論文と　② O'Reilly本から適宜転載しつつ確認 Mikolov 氏他　word2vec 論文を読み解くと、、、以下の知見が掲載されている Mikolov ほか共著（論文）"Efficient Estimation of Word Representation in Vector Space" ① コーパスの単語数が多けれは多いほど、モデルの次元数が大きければ大きいほど、意味演算の正確性の精度は高まる。（モデルの次元数が大きい場合は、コーパスサイズも相応にないと精度は落ちる） ② 文法的（ Syntactic ）には、 NNLM が、意味的（ Semantic ）には Skip-gram が精度が高い ③ コーパスのサイズが2倍になれば、モデルの次元数も2倍にするべきである（以下、Miko
zmsgnk 2014/09/25
word2vec

MeCab
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx