1,2年くらい前から自然言語処理界隈などを賑わせているらしいword2vec1は,その実行速度が非常に速いことで有名でもある23が,その一方で,ソースコードが非常に読みにくいことが一部で知られている4.例えば,a, bなどの1文字の変数があったりとか,一部で論文に一切記載のない手法の改良?が数点施されていたりする.本記事では,諸事情でword2vecの解読をしたけど結局その話は使わないことになった筆者が,「高速化の技法」「論文に記載のない変更点」「その他」の3点について備忘録として雑に説明していく.(なお,何か誤り等あったらコメント,twitterで言及などで指摘していただけるとありがたいです) なお,最適化や更新式の導出などの話はここではしないので,その辺については適当な解説論文56を参考にしてほしい. また,自分でも解読をしたいという稀有な人には,gensim.models.word2