執筆時のBGM:アイドルネッサンス「夏の決心」 アイドルネッサンス「夏の決心」(MV) まえがき 世の中の「でーたさいえんてぃすと」はとうの昔に通り過ぎてしまったところだろうけど、「言葉の意味」をベクトル空間にマッピングして、様々に操作(計算)できるword2vecで遊んでみた記録。 自然言語処理に新風を巻き起こしたWord2Vecとは何か - 日経BigData (PDF)深層学習の最近の進展 みずほ情報総研技報 Vol.7 No.1 前提 今回は、慣れているR(最近はMicrosoft R Open)のwordVectorsパッケージを使う。また、テキストデータは、昨年夏前ころにダウンロードした、Wikipedia日本語版のダンプXMLを使う。 作業環境 たまたま、自分のPCがそうだ、というだけなのだけど。ただ、メモリは十分に必要。ソフトウェア類は、基本的に最新のものをダウンロードすれ