本記事はQiitaの機械学習の数理 Advent Calendar 2018の8日目の記事です. 単語の「意味の広がり」を捉えられる単語埋め込み手法であるガウス埋め込みについて紹介します. だいたいこの論文の説明です. はじめに もはやNLPの必須ツールとなったword2vec,というかSkipgramに代表される単語分散表現ですが,単語の意味のモデル化という意味ではいくつかの問題点もあります. そのうちの一つが,「1つの単語に1つのベクトルを割り当てる」点推定になっており「単語の意味の広がりを捉えられない」という点です. 例えば下図に示すように, Bach $\in$ composer $\in$ man manは非常に広い意味をもつ composerはもう少し狭い Bachは人名なのでよりspecificな意味 といった単語同士の意味の重なりや包含関係をembeddingの空間上で分析
![ガウス埋め込みによる「意味の広がり」を捉える単語埋め込み - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/f47c17af990d3224e0f2083855dad6930289a96d/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Fadvent-calendar-ogp-background-7940cd1c8db80a7ec40711d90f43539e.jpg%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9JUUzJTgyJUFDJUUzJTgyJUE2JUUzJTgyJUI5JUU1JTlGJThCJUUzJTgyJTgxJUU4JUJFJUJDJUUzJTgxJUJGJUUzJTgxJUFCJUUzJTgyJTg4JUUzJTgyJThCJUUzJTgwJThDJUU2JTg0JThGJUU1JTkxJUIzJUUzJTgxJUFFJUU1JUJBJTgzJUUzJTgxJThDJUUzJTgyJThBJUUzJTgwJThEJUUzJTgyJTkyJUU2JThEJTg5JUUzJTgxJTg4JUUzJTgyJThCJUU1JThEJTk4JUU4JUFBJTlFJUU1JTlGJThCJUUzJTgyJTgxJUU4JUJFJUJDJUUzJTgxJUJGJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnR4dC1jb2xvcj0lMjMzQTNDM0MmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmcz0zZDVjODQ2ODhjZGQ2YjMyN2UzOTM0NWFhNzFjODNkMg%26mark-x%3D120%26mark-y%3D96%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9OTcyJnR4dD0lNDBzdGZhdGUmdHh0LWNvbG9yPSUyMzNBM0MzQyZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTg0YjRhNmE4MWZjNGRjMWU4ODBkYzQ4ODBjMWEzZDVl%26blend-x%3D120%26blend-y%3D500%26blend-mode%3Dnormal%26s%3D6de18bdfab15f685e898ef6544f80c47)