そもそも 最近?巷で流行っているword2vecですが、 (word2vecで何ができるの?という方はあんちべさんのブログをみてみるとイメージしやすいかと思います。 ただ、中身のロジックであるC-BOWとskip-gramが全然わからないので コードから何をやっているんだろうというのを理解しようとしてみました。 その時のメモです。(ほぼCBOWについてしか書いてないです) リポジトリの中身 実際に使ってみたことのある方はわかるかと思いますが、 * distance.c * word2analogy.c * word2vec.c * word2phrase.c と、これらに似たような名前の.shファイルが見つかります。 .shの中身は大体以下の内容です。 学習データの取得 word2vecによる学習 各種デモの実行(distance/word2analogy/word2phrase) dem