タグ

nlpとbertに関するincepのブックマーク (5)

  • 【2024年最新】出会い系サイト・アプリおすすめ10選

    【2024年最新版】出会い系サイト・アプリおすすめ10選を厳選してご紹介! 1.ハッピーメール ハッピーメールは、まるで楽しい冒険とエッチな出会いが待っている特別な場所。ユーザーたちの悪い~中立な口コミと良い口コミを通して、その楽しさと刺激がどれほど素敵な出会いを約束しているかをじっくりと見てみましょう。 悪い~中立な口コミ 一部のユーザーからの悪い~中立な口コミには、利用料金の高さへの不満が見受けられます。しかし、これはまるで素敵な冒険の入場料。冒険の舞台で広がる楽しさや刺激が、その価値を十分に補っていると感じるユーザーも多くいます。楽しさに満ちた冒険とエッチな出会いに興奮する者にとって、支払う価値は充分にあることでしょう。 また、理想と現実のギャップに戸惑うユーザーもいますが、これは素敵な出会いの舞台においても同じこと。期待に胸を膨らませながらも、現実的なアプローチが求められる瞬間でも

    【2024年最新】出会い系サイト・アプリおすすめ10選
  • ダジャレを判定する - Stimulator

    - はじめに - 近年、IT業界ダジャレは熾烈の一途を辿っている(ITだけに) 。 類義語を巧みに取り入れたダジャレ、難読化されたダジャレなどが増加し、一体どれで「初笑い」すれば良いのか悩む若者も少なくない。 そのような背景があり、ダジャレを判定するアルゴリズムの開発も盛んである。 ルールベースによる判定では、@kurehajimeが提案、開発したdajarep *1 や、@fujit33によるShareka *2が存在する。特にSharekaは、ルールベースのロジックにも関わらず、反復型とされる種類のダジャレに対して高い精度での判定を可能にしている。また、機械学習モデルを用いた判定手法として、谷津(@tuu_yaa)らが開発したDajaRecognizer *3がある。DajaRecognizerは、多くのルールベースによって子音音韻類似度をPMIとして定義、Bag-of-Words、

    ダジャレを判定する - Stimulator
  • 日本語話し言葉BERTを作成、公開します! - Retrieva TECH BLOG

    こんにちは。 カスタマーサクセス部リサーチャーの勝又です。 私はレトリバで自然言語処理、とくに要約や文法誤り訂正に関する研究の最新動向の調査・キャッチアップなどを行っております。 今回の記事では、国立国語研究所様との共同研究で作成した日語話し言葉BERTとその利用方法について紹介します。 概要 BERTの簡単な説明 話し言葉BERT作成方法 書き言葉BERTの文法を表現する部分のみをCSJで追加学習 書き言葉BERTに対して、話し言葉データを用いた分野適応 実験 文法を表現する部分のみを追加学習することの有効性の確認 話し言葉データを用いた分野適応を行うことの有効性の確認 日語話し言葉BERTの公開 ご利用方法 まとめ 概要 近年、自然言語処理の分野ではBERT(Bidirectional Encoder Representations from Transformers)と呼ばれるモ

    日本語話し言葉BERTを作成、公開します! - Retrieva TECH BLOG
  • Huggingface Transformers 入門 (8) - トークナイザー|npaka

    1. トークナイザー「トークナイザー」は、「テキスト」を「トークン」に分割し、それを「ID」に変換する機能を提供します。「テキスト」はそのままではニューラルネットワークで処理できないため、IDに変換する必要があります。 2. トークン化の方法テキストのトークン化は見た目以上に大変な作業で、トークン化の方法は複数あります。 ・単語 ・文字 ・サブワード2-1. 単語によるトークン化◎ スペースによるトークン化 一番簡単なトークン化の方法は、「スペースによるトークン化」です。 "Don’t you love 🤗 Transformers? We sure do." ↓ ["Don't", "you", "love", "🤗", "Transformers?", "We", "sure", "do."] これは良い第1歩ですが、"Transformers? " や "do. " というトーク

    Huggingface Transformers 入門 (8) - トークナイザー|npaka
  • GitHub - cl-tohoku/bert-japanese: BERT models for Japanese text.

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - cl-tohoku/bert-japanese: BERT models for Japanese text.
  • 1