タグ

2016年2月13日のブックマーク (1件)

  • 分散表現(単語埋め込み) - 岩波データサイエンス

    特集記事「単語の意味をコンピュータに教える」(岡崎直観)、「自然言語の意味に対する2つのアプローチ—記号表現と分散表現」(宮尾祐介)、およびコラム「Pythonword2vec」(中谷秀洋)で紹介した 分散表現(単語埋め込み) についてです。 分散表現(あるいは単語埋め込み)とは、単語を高次元の実数ベクトルで表現する技術です。 近い意味の単語を近いベクトルに対応させるのが分散表現の基ですが、最近はベクトルの足し算が意味の足し算に対応する「加法構成性」などを中心に、理論や応用の研究が進んでいます。 word2vec Skip-gram(特集記事参照)を実装した、単語の分散表現を生成するツールです。大きなコーパスからの学習と加法構成性を特徴としています。 GloVe 同じく単語の分散表現を生成するツールです。word2vec より高い性能をうたっています。 gensim Python

    分散表現(単語埋め込み) - 岩波データサイエンス