こんにちは、DSOC R&Dグループ研究員の奥田です。言語処理学会年次大会(NLP2019)の開催されている名古屋のホテルで今まさにこの記事を書いています。ひつまぶし美味しかったです。 さて、今回はCONLL 2018で発表されたSimple Unsupervised Keyphrase Extraction using Sentence Embeddingsを実装して日本語を対象に評価しましたので、その紹介です。こちらは1/31に開催された「第一回SIL勉強会 自然言語処理編」での発表を加筆修正したものですので、そちらの資料も合わせてご覧いただければと思います。 EmbedRankとは 本論文で提案されているEmbedRankとは、教師データを用意することなく、文章に含まれる重要なキーフレーズを抽出するアルゴリズムです。あるフレーズが重要かどうかは、それが含まれる文章全体の意味をよく表し
![文章埋め込みを用いた教師なしキーフレーズ抽出EmbedRankの実装とその評価 - Sansan Tech Blog](https://cdn-ak-scissors.b.st-hatena.com/image/square/8b4ec348c8f413acb5658c52a76ff4da2fb52b38/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fy%2Fyag_ays%2F20190313%2F20190313095921.png)