タグ

gptに関するskypenguinsのブックマーク (5)

  • 埋め込み型のデータベースを使った質問への回答:text-embedding-ada-002チュートリアル|はまち

    OpenAI-Cookbookで公開されている、大量のテキストを駆使して質問に答えるシステム構築に有利な、埋め込み型検索を用いた質問応答の例題を試してみました。 https://github.com/openai/openai-cookbook/blob/main/examples/Question_answering_using_embeddings.ipynb モデルのファインチューニングは例えると、1週間先の試験のために勉強するようなもので、試験番になると、モデルは詳細を忘れてしまったり、読んだことのない事実を間違って記憶してしまったりするので、大量のテキストから質問に答えるシステムを構築するには、埋め込み型検索を用いた「Search-Ask」方式を使うのがオススメとのこと。 まずは、通常のChatGPTで質問してみましょう。 不正解! 菅野よう子さんのトップをねらえ!の音楽も聴い

    埋め込み型のデータベースを使った質問への回答:text-embedding-ada-002チュートリアル|はまち
  • Zero-shot Learning入門 - エクサウィザーズ Engineer Blog

    こんにちは。エクサウィザーズで画像ギルドに所属し、機械学習エンジニアをしている小島です。今年の3月からこちらにジョインいたしました。 この記事では、弊チームで取り組んいるテーマ「Zero-shot Learning」について、歴史的な背景を振り返りつつ、簡単な実装を紹介します。今研究でホットな研究テーマの一つである「クロスモーダルモデル」を身近に感じていただければ幸いです。 Zero-shot Learningとは 「Zero-shot Learningとは何か」というのは、実は曖昧なテーマです。「これがZero-shotだ」という定義が論文によって異なるためです。わかりやすい理解の仕方としては、Many-Shot Learning、One/Few-shot Learningから天下り的に考えていくことでしょう。 画像系の機械学習の問題は、大きく分けて、タスクの軸とデータ数の軸の2軸で考え

    Zero-shot Learning入門 - エクサウィザーズ Engineer Blog
  • OpenAI API を用いた文書校正(誤字脱字検出) | blog.jxck.io

    Intro OpenAIAPI を用いて、長年の課題だった文書校正を VSCode 上で実現するプラグインを修作したところ、思った以上の成果だった。 文章校正と誤字脱字検出 執筆を補助するツールは多々開発されているが、基形態素解析を用いた品詞分析の延長で行うものが多かった。 よくある「助詞の連続」、「漢字の開き閉じ」、「一文の長さ」などは、ある程度の精度で検出可能ではあるが、結局執筆時に一番検出して欲しいのは「誤字脱字」だ。 文体をどんなに揃えたところで、誤字脱字があるとやはりクオリティが低く感じるし、そこさえ抑えられていれば、他のスタイル統一は訓練である程度なんとかなる。 英語のスペルチェックはかなり進んでいるが、日語においてはそこまで革新的なものが見当たらない。あらゆるツールを試したが、結局満足のいく精度が出る誤字脱字検出は「Word の校正機能」しかなかった。 そこで筆者

    OpenAI API を用いた文書校正(誤字脱字検出) | blog.jxck.io
  • ChatGPTは馬鹿じゃない! 真の実力を解放するプロンプトエンジニアリングの最前線

    はじめに ChatGPTをはじめとしたLLMを使いこなすための必須スキル、プロンプトエンジニアリング について解説します。 最近は動きが早すぎてキャッチアップが難しくなっていますが、特に以下のような手法が注目されているようです。 In-context Learning (ICL) Chain-of Thought (CoT) Zero-shot CoT ReAct Self-Consistency Program-aided Language Model (PAL) 今回は、6つのテクニックの中からPart1として、ICL、CoT、そしてZero-shot CoTの3つを紹介します。 これらのテクニックは、ChatGPTをはじめとするLLMのポテンシャルを最大限に引き出すために必要不可欠です。 さらに、各テクニックを詳しく解説した論文も紹介していますので、是非ご一読ください。 In-con

    ChatGPTは馬鹿じゃない! 真の実力を解放するプロンプトエンジニアリングの最前線
    skypenguins
    skypenguins 2023/03/12
    プロンプトエンジニアリングとか大層な名前付けてんなってちょっと思ってたけど、こりゃすげーな…LLMはデカすぎて奥が深い
  • 13億パラメータ日本語GPT-2を使ってみる

    2021年11月18日にOpenAIが「GPT-3」のウェイティングリストを解除すると発表しました。 これにより申請すれば誰でもGPT-3APIを使用できるようになります。 ということで、GPT-3 ... ただ、上記の記事でも紹介していますが、日語に特化したモデルではなく、やっぱり日語で生活している人にとっては日語のGPTが欲しくなりますね。 そこで、13億パラメータを持つGPT-2のモデルを日語で学習して、公開してくれたのがこの「rinna」社です。 ということで今回は、この日語GPT-2を触ってみたいと思います。 なお、今回はモデルの説明は一切ありませんので、詳細についてはこちらの記事を参照していただければと思います。 GPT ... 『【論文解説】OpenAI 「GPT」を理解する』 一番仕組みを詳しく解説しています。GPT-2 ... 『【論文解説】OpenAI 「G

    13億パラメータ日本語GPT-2を使ってみる
  • 1