タグ

ブックマーク / data-analytics.fun (2)

  • 【論文解説】OpenAI GPT-4 を理解する

    さて、ChatGPT が非常に盛り上がっていますが、2022年11月にリリースされた ChatGPTGPT-3.5 というモデルがベースになっています。 そして、2023年3月にはその後継モデルである GPT-4 がリリースされ、ChatGPT Plus で利用できるようになっています。(月額20$) それ以降も画像データを処理できるようになったり、個人の好みを記憶できるようになったりと色々なアップデータがあってこの先どうなるんだろうと楽しみになりますね。 今回は、もともとの GPT-4 についてしっかりと解説したいと思います。 ちょっとした対話であれば GPT-3.5 でも GPT-4 でもそこまで大きな差はないように思えますが、GPT-4 に情報抽出や分類問題などのタスクを解かせようとすると、GPT-4 の方がかなり精度が良くなっていることがわかります。 ですので、より複雑な利用

    【論文解説】OpenAI GPT-4 を理解する
    shion214
    shion214 2023/05/19
  • 13億パラメータ日本語GPT-2を使ってみる

    2021年11月18日にOpenAIが「GPT-3」のウェイティングリストを解除すると発表しました。 これにより申請すれば誰でもGPT-3APIを使用できるようになります。 ということで、GPT-3 ... ただ、上記の記事でも紹介していますが、日語に特化したモデルではなく、やっぱり日語で生活している人にとっては日語のGPTが欲しくなりますね。 そこで、13億パラメータを持つGPT-2のモデルを日語で学習して、公開してくれたのがこの「rinna」社です。 ということで今回は、この日語GPT-2を触ってみたいと思います。 なお、今回はモデルの説明は一切ありませんので、詳細についてはこちらの記事を参照していただければと思います。 GPT ... 『【論文解説】OpenAI 「GPT」を理解する』 一番仕組みを詳しく解説しています。GPT-2 ... 『【論文解説】OpenAI 「G

    13億パラメータ日本語GPT-2を使ってみる
  • 1