タグ

NLPに関するktykogmのブックマーク (4)

  • 日本語CLIP 学習済みモデルと評価用データセットの公開

    はじめに 基盤モデル がAIの新潮流となりました。基盤モデルというとやはり大規模言語モデルが人気ですが、リクルートでは、画像を扱えるモデルの開発にも注力しています。画像を扱える基盤モデルの中でも代表的なモデルのCLIPは実務や研究のさまざまな場面で利用されています。CLIPの中には日語に対応したものも既に公開されていますが、その性能には向上の余地がある可能性があると私たちは考え、仮説検証を行ってきました。今回はその検証の過程で作成したモデルと評価用データセットの公開をしたいと思います。 公開はHugging Face上で行っていますが、それに合わせて記事では公開されるモデルやデータセットの詳細や、公開用モデルの学習の工夫などについて紹介します。 記事の前半では、今回公開するモデルの性能や評価用データセットの内訳、学習の設定について紹介します。記事の後半では大規模な学習を効率的に実施す

    日本語CLIP 学習済みモデルと評価用データセットの公開
  • GitHub - google/budoux

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.

    GitHub - google/budoux
  • ChatGPT の仕組みを理解する(前編) - ABEJA Tech Blog

    こんにちは!株式会社 ABEJA で ABEJA Platform 開発を行っている坂井(@Yagami360)です。世間では ChatGPT などの大規模言語モデル(LLM)による対話型 AI が盛り上がってますね。クオリティーも凄いし AI 業界以外でも盛り上がってると嬉しいですよね。この数年で一段と AI の社会実装が業界以外の人にも目に見える形で進んできたなあと実感しております。 自分は普段業務では ABEJA Platform という AI プロダクトやその周辺プロダクトのバックエンド開発とフロントエンド開発をやっているのですが、AI 業界所属していながら ChatGPT などの LLM 全然追いかけれていない状態になっちゃてて自責の念にかられているので、このブログ執筆という良い機会に ChatGPT の仕組みについて調べてみました。 記事の対象読者としては、以下のようになりま

    ChatGPT の仕組みを理解する(前編) - ABEJA Tech Blog
  • 【入門者向け】Perplexityを直観的に理解する

    今回は、BERT や GPT3 などの言語モデルを評価する際に一般的に利用されている perplexity (パープレキシティ)について解説したいと思います。 ここでは、厳密な説明というよりは直観的にわかりやすく、論文等を読んでいてぱっとイメージが湧くような説明をしたいと思います。 言語モデルとは まず、言語モデルとは、ざっくり言うと次にどんな単語が出現する?かという確率を計算するモデルのことを言います。 これではわかりにくいので簡単な例で見てみましょう。 例えば「私は 犬が 好き です」という文章があるとします。 そして、「私は 犬が 好き (  )」として、カッコの中に入る単語は以下のうちどれでしょう?という問題を考えます。 です 行った 丸い 犬 日語がある程度わかっている人であれば、文法的にも意味的にも2の「です」を選ぶのではないでしょうか。 これは、「?」に入る可能性の高い

    【入門者向け】Perplexityを直観的に理解する
    ktykogm
    ktykogm 2023/04/13
  • 1