<エムスリー Advent Calendar 2020 まで残り1日となりました。Advent Calendar本編に先んじて新卒1〜2年目メンバーが執筆します。> エムスリーのエンジニアリンググループ AI・機械学習チームの李です。インターン累計2ヶ月+新卒入社8ヶ月にして初めての投稿になります。今回はキーフレーズ抽出アルゴリズムの1つであるEmbedRankを医療記事タグのスコアリングに使ってみた話を紹介したいと思います。 背景 エムスリーでは、ニュースや海外ジャーナルをはじめに、様々な自然言語ベースのコンテンツを取り扱っております。関連記事の表示などの応用先で素性として使われているのは、事前に用意した辞書から選ばれ記事に付与されたタグです。そのタグ付けの役目を担うのはGaussという基盤的なシステムです(Gaussについて紹介するブログはすでにあったのでここは詳細を割愛しますが、気に