本文「python pickle dump example」を検索

1 - 6 件 / 6件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

python pickle dump exampleの検索結果1 - 6 件 / 6件

はじめての自然言語処理 Fusion-In-Decoder でクイズに答えるモデルを作る | オブジェクトの広場
- 13 users
- www.ogis-ri.co.jp
- テクノロジー
- 2022/09/07
今回は Fusion-In-Decoder を使ってクイズに答えるモデルを作ります。以前から Wikipedia 等の外部情報を参照できるテキスト生成モデルを試してみたいと思っていました。Fusion-In-Decoder の発表は 2020 年なので少し前のモデルですが、T5 ベースで手軽に試せるサイズ感ですので、日本語で試してみましょう。 1. はじめに今回紹介する Fusion-In-Decoder（以下、FiD ）1 は Meta AI (当時は Facebook AI Research) が発表した Open Domain question Answering タスクを解くテキスト生成モデルです。じつは、以前から外部情報を参照できるテキスト生成モデルを試してみたくて2、 Google の RETRO3 の論文を読んでたんです。なのですが、外部情報のサイズ感が 1000 B
- NLP
- 自然言語処理
- 機械学習
- 勉強
- language
- 言語
- 学習
はじめての自然言語処理 DeepSpeed-Chat による RLHF の紹介 | オブジェクトの広場
- 6 users
- www.ogis-ri.co.jp
- テクノロジー
- 2023/07/14
今回は DeepSpeed-Chat による RLHF のご紹介です。正直、データセットや計算資源の都合もあり、とりあえず動かしてみました！的な話にはなりますが、RLHF の効果が実際に確認できるか見てみたいと思います。 1. はじめに今回は DeepSpeed-Chat1 を使って RLHF を試してみたいと思います。RLHF は Reinforcement Learning from Human Feedback の略で文字通り「人からのフィードバックを用いた強化学習」ということですね。OpenAI が InstructGPT(ChatGPT の元になったモデル)2 で使ったことで注目された手法になります。 LLM がらみで何か記事にしたいと思いつつ、日々新たな LLM が発表されている昨今に、隔月＆内容が実時間から月単位で遅れ気味wの本連載です。「どうしたもんかな。。。」と悩みに
- 機械学習
- 言語
Tutorial: ChatGPT Over Your Data
- 6 users
- blog.langchain.com
- テクノロジー
- 2023/02/13
Note: See the accompanying GitHub repo for this blogpost here. ChatGPT has taken the world by storm. Millions are using it. But while it’s great for general purpose knowledge, it only knows information about what it has been trained on, which is pre-2021 generally available internet data. It doesn’t know about your private data, it doesn’t know about recent sources of data. Wouldn’t it be useful i
- あとで読む
Understanding GPU Memory 1: Visualizing All Allocations over Time – PyTorch
- 4 users
- pytorch.org
- テクノロジー
- 2023/12/15
Blog Understanding GPU Memory 1: Visualizing All Allocations over Time During your time with PyTorch on GPUs, you may be familiar with this common error message: torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 512.00 MiB. GPU 0 has a total capacity of 79.32 GiB of which 401.56 MiB is free. In this series, we show how to use memory tooling, including the Memory Snapshot, the Memo
Locality Sensitive Hashingを用いた大規模コーパスの準重複文書排除
- 3 users
- zenn.dev/d2c_mtech_blog
- テクノロジー
- 2023/11/24
0. はじめにこんにちは、株式会社D2Cデータサイエンティストの董です。 D2Cでは、広告配信を効率よく効果よく行うために様々な機械学習モデルを活用しています。今回の記事では、大規模テキストコーパスを用いた言語モデルの学習にあたり、学習データにある準重複文書の除外テクニックについてご紹介します。 1. 開発環境 AWS EC2 (インスタンスタイプ: r5.8xlarge) Python 3.10系 2. Pythonパッケージ transformers scikit-learn 3. 広告文の準重複問題テキスト広告では、キャッチコピーや宣伝文を少しだけ修正して複数回配信し、その効果を測定することがよくあります。また、シリーズ商品の説明文を同じテンプレートに従って大量に作成することも一般的です。それゆえに、広告文を収集してテキストコーパスを作ると、準重複サンプル、つまり完全には重複
ゼロから始める自作LLM｜Masayuki Abe
- 3 users
- note.com/masayuki_abe
- テクノロジー
- 2024/02/18
今回は、Google Colabで自作LLMの完成を目指す記事となります。既成LLMをどのように使うかの記事を書いて来ましたが、LLMをどのように作るかの記事がなかったので今回書いてみることにしました。 GitHubに自作LLMを作っているページがありましたので、利用させて頂いております。 GitHubのこちらのページは凄く有益ですので、一度読んでみることをおすすめいたします。今回は、上記ページのコードを参考に、Google Colabで実装していきます。今回は、自作LLMを完成させてみようということを目的に書きますので、精度などは問題がありますが、記載のとおりGoogle Colabに貼り付けてもらえれば自作LLMの完成という成功体験を積むことに主眼を置いています。ハイパーパラメータを変更すると考えることが増えるので、原則変更しない方向でいきます。 Google Colabのリソ