タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

*algorithmとBERTに関するsh19910711のブックマーク (2)

  • 【自然言語処理】プリンを含む文がポケモンかどうか分類してみた - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? エイチームフィナジーアドベントカレンダー最終日はs2terminalが担当します。私は普段、Web開発やデータサイエンス等を担当していますが、今年は 自然言語処理 技術に多く触れていました。 稿では自然言語処理を用いて、「プリン」 に関する文書が私の大好きなポケモンのプリンを指しているのかどうかを分類します。自然言語処理技術の中でも古典的な手法である BoW と、比較的新しい BERT を用いて、すばやく正確に分類できること目指します。 プリンとは プリン(Jigglypuff) とは、ポケットモンスター(以下ポケモン)に登場するキャ

    【自然言語処理】プリンを含む文がポケモンかどうか分類してみた - Qiita
    sh19910711
    sh19910711 2022/03/19
    "2021年はプリンの年だった / おそらくインターネット上にはプリンに関するブログ投稿等の文書で溢れかえっており、それらが本当にポケモンのプリンであるかどうか分類する問題の重要性も高まるのではないか"
  • 書籍レビューを用いた潜在表現の獲得とクラスタリングの実施 - rmizutaの日記

    はじめに 書籍に関連する情報を用いてその潜在表現をうまく獲得することで、 以下のようなことができないかなーと考えています。 自身の読書済みのと照らし合わせて カテゴリごとの網羅率の算出 を読んだ時に得られる情報量の算出 該当のの完読可能性の推定 を読むための事前知識の十分性確認 今回のスコープ 書籍に関する情報の1つであるレビュー情報を用いて潜在表現を作成し、 クラスタリングを行うことでその有効性の確認を行います。 潜在表現の作成は以下の2通りの方法で行いました。 1.TFIDF+LDA 2.Sentence-BERT 実施したこと ブクログの2020年の登録者数の多い1000冊に対しレビューを取得、そこから30件以上レビューがある429冊に絞り30579件のレビューを元に書籍の潜在表現を生成しクラスタリングを行いました。 1.TFIDF+LDA TFIDFで単語の出現頻度を元にし

    書籍レビューを用いた潜在表現の獲得とクラスタリングの実施 - rmizutaの日記
    sh19910711
    sh19910711 2021/07/17
    “レビューは本の内容をそのまま反映しているわけではなく、読んだ人自身がもつフィルタを通した出力 / 人によって印象に残る場面や感じ方に幅がある小説は出力結果が安定しないのではないかと感じました”
  • 1