タグ

ブックマーク / note.com/npaka (5)

  • OpenAI Codex の使い方|npaka|note

    1. Codex「Codex」は、自然言語と数十億行のコードの両方で学習したGPT-3ベースのモデルです。Pythonの能力が最も高く、JavaScriptGoPerlPHPRubySwiftTypeScriptSQL、Shell を含む10を超える言語を熟知しています。 「Codex」は、次のような様々なタスクに利用できます。 ・コメントをコードに変換。 ・コンテキスト内で次の行または関数を記述。 ・アプリケーションの有用なライブラリや API 呼び出しなどの知識の提供。 ・コメントの追加。 ・効率化のためのコードの書き直し。 2. Codexの使用例「Playground」でModelに「code-davinci-002」を指定して試しています。 2-1. 「Hello」と言う (Python)""" Ask the user for their name and say

    OpenAI Codex の使い方|npaka|note
    arrowKato
    arrowKato 2024/07/19
    copilotの実態は、codexだった
  • mergekit を使用してLLMをマージする|npaka

    以下の記事が面白かったので、かるくまとめました。 ・Merge Large Language Models with mergekit 1. モデルのマージモデルのマージは、2つ以上のLLMを1つのモデルに結合する手法です。これは、新しいモデルを安価に作成するための比較的新しく実験的な方法です (GPUは必要ありません)。モデルのマージは驚くほどうまく機能し、 「Open LLM Leaderboard」に多くの最先端のモデルが生成されました。 このチュートリアルでは、「mergekit」を使用して独自のモデル「Marcoro14-7B-slerp」を作成します。このモデルは、「Open LLM Leaderboard」 (02/01/23) で最高のパフォーマンスを誇るモデルになりました。 コードは「GitHub」および「Google Colab」で入手できます。「mergekit」を簡

    mergekit を使用してLLMをマージする|npaka
    arrowKato
    arrowKato 2024/05/14
  • RAG評価ツール ragas を試す|npaka

    RAG評価ツール「ragas」を試したので、まとめました。 1. ragas「ragas」は、「RAG」 (Retrieval Augmented Generation) パイプラインを評価するためのフレームワークです。「RAG」は外部データを使用してLLMのコンテキストを拡張するLLMアプリケーションです。「ragas」はこのパイプラインを評価して、パフォーマンスを定量化します。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) RAGパイプラインの準備。 今回は、以下の記事で作成した、ELYZAのRAGパイプラインを使います。 (2) パッケージのインストール。 # パッケージのインストール !pip install ragas datasets(3) 環境変数の準備。 「ragas」は「OpenAI API」で評価します。 import os import

    RAG評価ツール ragas を試す|npaka
  • LLMアプリケーションの記録・実験・評価のプラットフォーム Weave を試す|npaka

    LLMアプリケーションの記録・実験・評価のプラットフォーム「Weave」がリリースされたので、試してみました。 この入門記事は、「Weights & Biases」のご支援により提供されています。Weights & Biases JapanのNoteでは他にも多くの有用な記事が掲載されていますので是非ご覧ください。 1. Weave「Weave」は、LLMアプリケーションの記録、実験、評価のためのツールです。「Weights & Biases」が提供する機能の1つになります。 主な機能は、次のとおりです。 ・記録 : LLMとのあらゆるやり取りを記録。 ・実験 : 様々なパラメータを試して結果を確認。 ・評価 : 評価を実行してモデルが改善されたかどうかを測定。 2. Weave の準備今回は、「Google Colab」で「Weave」を使って「OpenAI」のモデルの記録・実験・評価を

    LLMアプリケーションの記録・実験・評価のプラットフォーム Weave を試す|npaka
    arrowKato
    arrowKato 2024/04/30
    Weave。 weight & bias社が出している評価プラットフォーム
  • OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka

    以下の記事が面白かったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。 開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

    OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
  • 1