Abstract 自然言語処理分野の 1 つのアプローチとして word2vec が注目されている。word2vec は、ニュ ーラルネットワークの学習に基づき、与えられた 文章から単語のベクトル表現を生成する。本研究 では、類似する食品単語に対して密なベクトル空 間の構築とその評価を目的とした。word2vec の 入力コーパスは、各食品のカテゴリや原材料情報 を web 上で取得し、ジェネレータにより作成し た。食品のカテゴリ、原材料を学習させたコーパ ス1、原材料のみを学習させたコーパス 2 を作成 し、それぞれのベクトル空間を構築した。構築し たベクトル空間は k-means 法により 30 のクラス タに分類し、評価を行った。具体的には、各クラ スタ間のデータの分散値、含有率の比較、各クラ スタ内でのユークリッド距離、コサイン類似度に よる類似語検索、PCA 法による低次元圧縮上