埋め込みとは、自然言語処理(Natural Language Processing, NLP)の文脈では、自然言語などの文章や単語を、数値的に扱えるようにベクトル化することを示します。 Embedding(埋め込み)の目的 埋め込みの主たる目的は、冒頭で述べたように、単語や文章を計算機で扱えるようなベクトルデータに変換することです。 通常の機械学習の入力はほぼ必ずベクトルになるので、自然言語などは何かしらの方法でベクトルの形式にする必要性があります。また文章だけでなく、カテゴリカルな値も、ベクトル化してあげる必要性があります。 通常、文章や単語などをベクトル化する手法として、one-hot-encoding(1-of-K表現)が知られています。しかし、実際には、one-hot-encodingはほとんどの値が0になる、スパース行列 になってしまうため、計算機のメモリを大量に使用してしまうた

