2021年9月21日のブックマーク (2件)

  • BERTによる日本語固有表現抽出の精度改善 〜BERT-CRFの紹介〜 - Sansan Tech Blog

    こんにちは、DSOC R&Dグループ インターンの笛木正雄です。大学院では離散最適化の研究室に所属しています。インターンでは、日々、知らないことだらけで、色々なことを経験させていただき、伸びしろを実感する毎日です。 現在は、SansanやEightのニュース配信に使用されている固有表現抽出(文章中から組織名を抽出するために使用)と呼ばれる自然言語処理タスクに携わっています。今回は、これまで取り組んだ固有表現抽出における精度改善の手法を紹介したいと思います。ありがたいことに、この手法は現在、プロダクトで実際に稼働しているため、思い入れのある手法です。 また、今回の手法を含め、日語固有表現抽出については、コード公開を予定しており、pipでインストールできるように現在進行中です。ご興味ある方は、お待ちいただき、合わせてご覧いただければ幸いです。 ※弊社のニュース配信における固有表現抽出タスクの

    BERTによる日本語固有表現抽出の精度改善 〜BERT-CRFの紹介〜 - Sansan Tech Blog
    shunk031
    shunk031 2021/09/21
  • エムスリー AI・機械学習チームのSIGIR'21推し論文を紹介するぜ! - エムスリーテックブログ

    エムスリーエンジニアリンググループ AI機械学習チームでソフトウェアエンジニアをしている中村(@po3rin) です。 好きな言語はGo仕事では主に検索周りを担当しています。 エムスリー のAI機械学習チームでは情報検索論文輪読会を隔週で行っています。MLエンジニアだけでなく、ソフトウェアエンジニアも参加しているのが弊社の論文読み会の特徴で、専門関係なくチーム全体で情報検索/推薦に関する知識を高めていく場になっています。 最近、情報検索論文輪読会の特別企画としてSIGIR'21ワイワイ祭を開催しました。各々が1つのセッションを選び、そのセッション内の全ての論文をまとめて発表する祭です。今回はAI機械学習チームメンバーが担当したセッションごとに、推し論文の紹介をしていきます。 Optimizing Dense Retrieval Model Training with Hard Ne

    エムスリー AI・機械学習チームのSIGIR'21推し論文を紹介するぜ! - エムスリーテックブログ
    shunk031
    shunk031 2021/09/21