"Fine Tuning"の人気記事 77件 - はてなブックマーク

1 - 40 件 / 77件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

"Fine Tuning"の検索結果1 - 40 件 / 77件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

"Fine Tuning"に関するエントリは77件あります。 AI、 LLM、 ChatGPT などが関連タグです。人気エントリには『【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) - Qiita』などがあります。

【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) - Qiita
- 897 users
- qiita.com/tmgauss
- テクノロジー
- 2023/03/30
生成AIカンファレンス〜徹底解剖「トップランナーから見た日本が挑む生成AIの最前線」〜日時：5月8日(水) 10:00-18:30 形式：オフライン・オンラインのハイブリッド開催場所：東京大学伊藤謝恩ホール（オンライン参加の方は配信URLをお送りします）参加方法：下記イベントページより申込 ChatGPT に代表される今日の AI ブームを牽引しているのは大規模言語モデル（Large-scale Language Model, LLM）と言っても過言ではないでしょう。LLM とは大量のテキストデータを使ってトレーニングされた自然言語処理のモデルで、代表的なものに、GPT（OpenAI）、Llama（Meta）、PaLM（Google）があります。我々開発者は、事前学習されたこれらのモデルを使って簡単にアプリケーションを作ることができます。 LLM が遂行可能な言語的タスク LL
- ChatGPT
- AI
- あとで読む
- 学習
- GPT
- 機械学習
- LLM
- 勉強
- qiita
- チューニング
GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ
- 162 users
- tech.drobe.co.jp
- テクノロジー
- 2023/09/19
はじめに結論背景課題 Fine-tuning とは？ Data の準備 Fine-tuning を実施結果おわりに参考はじめにこんにちは、DROBE の都筑です。みなさん LLM 使っていますか。今回は GPT-3.5-turbo の Fine-tuning の事例を紹介します。結論 GPT-4 を利用して得られたデータを使って GPT-3.5-turbo を Fine-tuning する事で、特定のタスクに関しては GPT-4 相当の性能が出る事が確認できた GPT-4 利用時点で使っていたプロンプトをそのまま使った場合の性能が一番高く、token 節約のためにプロンプトの省略をすると性能が劣化した背景 LLM を利用したサービスの開発において、OpenAI を利用する場合にはモデルの選択肢がいくつかあります。2023年9月現在では、GPT-4 と GPT-3.5-
- ChatGPT
- あとで読む
- openai
- LLM
- AI
- 文章生成AI
- gpt
- 人工知能
- techfeed
- プロダクト
【速報】OpenAI APIでGPT-3.5-turboがfine-tuningできるようになりました！！ | DevelopersIO
- 129 users
- dev.classmethod.jp
- テクノロジー
- 2023/08/23
ただし、GPT-4と比較すると安価にはなっていますので、性能比較をしながら良い塩梅を探すとコスト的にメリットがある可能性があります。また学習のコストですが、以下のように学習データ全体のトークン数 x エポック数という形で費用が掛かるので注意が必要です。（エポック数は後述するようにパラメータとして指定可能です） For example, a gpt-3.5-turbo fine-tuning job with a training file of 100,000 tokens that is trained for 3 epochs would have an expected cost of $2.40. 公式ページは以下となりますので、併せてご確認ください。レート制限 fine-tuningのレート制限については、以下に記載があります。 fine-tuningについては以下のように
- ChatGPT
- あとで読む
- OpenAI
- api
- AI
- 文章
- content
- FILE
- LLM
- id
GPT-3.5 Turbo fine-tuning and API updates
- 97 users
- openai.com
- テクノロジー
- 2023/08/23
Developers can now bring their own data to customize GPT-3.5 Turbo for their use cases. Fine-tuning for GPT-3.5 Turbo is now available, with fine-tuning for GPT-4 coming this fall. This update gives developers the ability to customize models that perform better for their use cases and run these custom models at scale. Early tests have shown a fine-tuned version of GPT-3.5 Turbo can match, or even
- AI
- あとで読む
- openai
- ChatGPT
- techfeed
- API

OpenAI APIのFine-tuningを試してみる | DevelopersIO
- 53 users
- dev.classmethod.jp
- テクノロジー
- 2023/04/18
手順トレーニングデータを準備してアップロードする新しいFine-tuningされたモデルをトレーニングする Fine-tuningモデルを使用するドキュメントに沿って行っていくので、APIの利用はOpenAIのCLIを使って実行してきます。以下のコマンドでインストール。・ pip install --upgrade openai openaiのAPI keyを環境変数にセットします。 export OPENAI_API_KEY="<OPENAI_API_KEY>" サンプルとして、ゲーム内のとある名称がスキルなのか爆発なのか分類させてみます。 chatGPTではこのように間違った回答を返していたので、正しい情報を学習させてみます。 1. トレーニングデータを準備してアップロードするトレーニングデータは、GPT-3に言いたいことを教える方法ですデータセットの準備に書いてあるベス
大規模言語モデルのFine-tuningによるドメイン知識獲得の検討 - Preferred Networks Research & Development
- 53 users
- tech.preferred.jp
- テクノロジー
- 2023/10/26
本記事は、2023年夏季インターンシッププログラムで勤務された竹田悠哉さんによる寄稿です。はじめに 2023年度のPFN夏季インターンに参加した、東京大学大学院工学系研究科の竹田悠哉と申します。学部では画像生成の研究をしていましたが、技術の社会実装をより俯瞰的に学びたいと思い、現在は技術経営戦略学専攻で教育工学の研究をしています。インターンでは「機械学習技術の社会実装」をテーマに、LLM（Large Language Model）にドメイン知識を習得させることに取り組みました。様々な設定において、主に英語で学習されたモデルであるLLaMA2に対して日本語のデータでのFine-tuningを行い、LoRAやInstruction Tuning、ドメイン知識の習得に関する知見を得ることができたと思います。本記事では、そこで利用した技術の紹介と、日本語におけるドメイン知識の習得に関する実験、
- LLM
- あとで読む
- AI
- モデル
Sentence BERTをFine TuningしてFAQを類似文書検索してみる - Taste of Tech Topics
- 51 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2023/01/16
こんにちは。社内データサイエンスチームYAMALEXの@Ssk1029Takashiです。最近はRTX4090のマシンを買って電気代が上がってきています。昨今NLP界隈では事前学習モデルが出てからは、検索というのもキーワードでの検索だけではなく、文章を入力にして似たような文章を探す類似文書検索も使われるようになりました。そんな中で、今回はFAQを対象にした類似文書検索をSentence BERTを使って試してみます。 FAQでよくある困りごと今回やること Sentence BERTとは検証 FAQデータセットから文章ベクトルを学習する回答文から文章ベクトルを生成する質問文から近しい回答を見つける単語が揺れてもいい感じに回答を取得できるのか検証まとめ FAQでよくある困りごと FAQはあらゆる場面で重要な情報源ですが、いまいち検索がしづらい情報でもあります。 FAQを利用し
Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜 | 株式会社AI Shift
- 46 users
- www.ai-shift.co.jp
- テクノロジー
- 2021/09/06
こんにちは AIチームの戸田です本記事では前回に引き続き、私がKaggleのコンペティションに参加して得た、Transformerをベースとした事前学習モデルのfine-tuningのTipsを共有させていただきます前回は学習の効率化について書かせていただきましたので、今回は精度改善について書かせていただきますデータ前回に引き続きKaggleのコンペティション、CommonLit-Readabilityのtrainデータを使います validationの分け方などは前回の記事を参照していただければと思います精度改善一般的なニューラルネットワークモデルの精度改善方法として、ハイパーパラメータのチューニングやData Augmentationが上げられますが、ここではBERTを始めとするTransformerをベースとしたモデル（以降Transformerモデル）特有の工夫について
ChatGPT の Fine-tuning を試したけど上手くいかなかった話
- 43 users
- zenn.dev/ml_bear
- テクノロジー
- 2023/08/24
これはなに？新しくリリースされた ChatGPT (GPT-3.5 Turbo) の Fine-tuning を試してみたメモ。 ChatGPTに最新の知識や専門知識を注入できるかどうかをテストしてみた。結局、自分が想定した動きにはできなかったので記事にして供養します🙏 tl;dr 一晩試してみた程度では、ChatGPTに最新の知識を教え込む目的での Fine-tuning はうまく動かなかった。 OpenAIが提示している想定のユースケースとずれている利用方法なので、もう少しトライしても上手くいかないんじゃないかなと思う。学習データに入れた質問をそのまま投げてあげると回答できることもある程度だった。(このままでは到底使えない…) 出力のトーンや言語の指示にプロンプトの文字数を大量に使っていて、それを大幅に削減したい、という時には使えそうだなという印象だった。学習データの自動生成
- ChatGPT
- LangChain
- OpenAI
- LLM
- あとで読む
- 学習
Prompt Tuning から Fine Tuning への移行時期推定
- 41 users
- speakerdeck.com/icoxfog417
- テクノロジー
- 2024/03/15
公開されている大規模言語モデルをどの程度のデータで Fine Tuning すれば Claude や ChatGPT などの API 公開されているモデルの精度に匹敵するのか検証した資料です。言語処理学会第30回年次大会併設ワークショップ日本語言語資源の構築と利用性の向上 (JLR2024…
- LLM
- あとで読む
- ai
作るだけなら簡単なLLMを“より優れたもの”にするには　「Pretraining」「Fine-Tuning」「Evaluation & Analysis」構築のポイント | ログミーBusiness
- 40 users
- logmi.jp
- テクノロジー
- 2023/12/05
より優れたLLMを作るために必要なこと秋葉拓哉氏：めでたくFine-Tuningもできた。これけっこう、びっくりするかもしれません。コードはさすがにゼロとはいかないと思いますが、ほとんど書かずに実はLLMは作れます。「さすがにこんなんじゃゴミみたいなモデルしかできないだろう」と思われるかもしれませんが、おそらく余計なことをしなければこれだけでも、まあまあそれっぽいLLMにはなるかなと思います。なので、ちょっと、先ほどの鈴木先生（鈴木潤氏）の話と若干矛盾してしまって恐縮なのですが、僕のスタンスは、LLMを作るだけであれば思っているよりは簡単かなと思います。ここまで前半でした。とはいえ、じゃあ、これをやったらGPT-4になるのかっていったら当然ならないわけです。そこにやはりギャップがあるわけですよね。「それは何なのか？」を次に考えていきましょうか。ここはかなりキリがないのですが、挙げられ
- llm
- あとで読む
- ai
OpenCALM-7BをLoRAでFine tuningして対話ができるようにする｜masuidrive
- 33 users
- note.com/masuidrive
- 暮らし
- 2023/05/25
ちょっと出遅れたけど、サイバーエージェントが出したGPT-NeoXベースのLLM、OpenCALM-7BをGoogle Colab上でLoRA使ってFine tuningをしてみました。とりあえず対話を試したい人masuidrive/open-calm-instruct-lora-20230525-r4-alpha16-batch32-epoch1 に1 epoch回したLoRAを置いておきます。 Google Colabで試したい人はV100やA100のハイメモリで動かしてください。OpenCALM-7Bのshardが10GB単位なため、12GBの標準メモリでは動きません。transformersのloaderがもう少し賢ければ、T4の標準メモリでも動くと思うんだけど・・・なぜFine tuningをするのかOpenCALM-7Bは基礎モデルなので日本語やWikiPediaの内容など
マルチモーダルLLMで複雑な画像を攻略：AOAIでGPT-4oをFine-tuning - Insight Edge Tech Blog
- 32 users
- techblog.insightedge.jp
- テクノロジー
- 2024/12/02
はじめに Insight EdgeのLLM Engineerの藤村です。昨今、企業のDX推進に伴い、社内に蓄積された大量の画像データや文書の効率的な活用が求められています。弊社では、実務でLLMを活用する際、画像や表形式、複雑な図を含むドキュメントの理解が大きな課題となっています。この課題は多くの企業でも同様に直面していると考えられ、その解決は業務効率化において重要な意味を持ちます。例えば： PowerPointの表やグラフの内容理解手書きのホワイトボード写真からの情報抽出複雑な組織図の階層関係の把握スキャンした文書の図表部分の解釈これらの課題に対して、以下の2点を検証しました：最新のマルチモーダルLLMでどこまで対応できるのか GPT-4oのファインチューニングによってどの程度改善できるのか目次はじめに目次マルチモーダル大規模言語モデルとは 1. 主要マルチモーダル
- LLM
- あとで読む
OpenAI(ChatGPT)のfine-tuning機能を早速試してみた~ひろゆきのスパチャを例に - Qiita
- 31 users
- qiita.com/MandoNarin
- テクノロジー
- 2023/08/24
はじめに OpenAI社から革命的な機能がリリースされました。 https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates タイトルにもある通り、fine-tuningが利用可能になったとのことです。これにより自分たちが持っているデータに合わせて学習させたモデルを作成し、利用することができるようになりました。 Developers can now bring their own data to customize GPT-3.5 Turbo for their use cases. 公式Twitter lets you train the model on your company’s data つまり、従来は一般論しか返してくれなかったものが、会社や組織独自の文脈のデータを教え込ませ、それに沿った回答を返してくれると
- ChatGPT
- GPT
- qiita
- あとで読む
- モデル
- tech
LLM Fine-Tuning (東大松尾研LLM講座 Day5資料)
- 29 users
- speakerdeck.com/schulta
- テクノロジー
- 2023/09/23
東大松尾研サマースクール2023「大規模言語モデル」Day5の講義で使用した資料です。大規模言語モデルの Fine-Tuning をテーマに、Instruction Tuning および Parameter Efficient Fine-Tuning について体系的に紹介することを目指した内容となってい…
- LLM
- tuning
- slide
- performance
- 勉強
- AI
- 研究
- あとで読む
Embeddingモデルを使ったベクトル化のしくみ、fine-tuning手法を解説
- 25 users
- speakerdeck.com/payanotty
- テクノロジー
- 2024/04/13
JavaScript: Past, Present, and Future - NDC Porto 2020
- あとで読む
LLM Supervised Fine-tuningの理論と実践
- 20 users
- speakerdeck.com/datanalyticslabo
- テクノロジー
- 2024/12/20
「LLM Supervised Fine-tuningの理論と実践」のイベント資料になります。 https://connpass.com/event/337694/ 実装編のPythonコードは、以下からご覧ください。 https://colab.research.google.com/dri…
- LLM
- チューニング
- あとで読む
- AI
- 資料
Hugging FaceでOpenAIの音声認識”Whisper”をFine Tuningする方法が公開されました | DevelopersIO
- 18 users
- dev.classmethod.jp
- テクノロジー
- 2022/11/09
こんちには。データアナリティクス事業本部機械学習チームの中村です。 OpenAIがリリースしたWhisperについて、先日Hugging FaceのブログでHugging Faceのフレームワークを用いたfine-tuningの実行方法が紹介されました。 fine-tuningにより、自社で蓄積された音声や書き起こしのデータセットがある場合は、特化した学習をすることが可能です。また著名なHugging Faceからfine-tuningの実装がリリースされたことで、今後様々なシーンでの応用の可能性を感じます。 Hugging FaceブログではHindi語を例として実施していますが、今回はこちらについて、日本語データを例にしながら動作を確認していきたいと思います。概要本記事では、Hugging Faceのフレームワークを用いたfine-tuningの実行を、日本語データセットを例
- Whisper
- あとで読む
Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編〜 | 株式会社AI Shift
- 17 users
- www.ai-shift.co.jp
- テクノロジー
- 2021/08/14
こんにちは AIチームの戸田です近年、自然言語処理タスクにおいて、BERTを始めとするTransformerをベースとした事前学習モデルを感情分類や質問応答などの下流のタスクでfine-tuningする手法が一般的になっています huggingfaceのTransformersなど、事前学習モデルを簡単に使うことのできるライブラリもありますが、Kaggleなどのコンペティションで上位に入るには素のモデルのままでは難しく、ヘッダや損失関数などの工夫などが必要です本記事では私がKaggleのコンペティションに参加して得た、事前学習モデルのfine-tuningのTipsを共有させていただきます書きたい内容が多くなってしまったので、今回は学習の効率化について、次回精度改善について、と２回に分けて書かせていただきます事前準備学習データとして、先日終了したKaggleのコンペティション、C
- BERT
- NLP
- Kaggle
- 機械学習
- performance
- study
- data
OpenAIの音声認識モデル Whisperの解説 / Fine Tuning 方法
- 13 users
- zenn.dev/fusic
- テクノロジー
- 2022/09/30
OpenAIから、かなりすごい音声認識モデル Whisperが発表されました。特出すべき点は、教師付き音声68万時間という、かなりヤバめのデータ量で訓練しており、英語では商用の音声認識システムや人間の書き起こしに匹敵する性能とのことです。社内でも日本語、ブルガリア語、韓国語で試してみましたが、すごい精度でした。日本語の場合、漢字の間違いが多々ありましたが、発音は大体あってそうでした。ブルガリア語は、ロシア語で認識されていました。韓国語は、完璧でした。しかし、Githubに公開されたコードを見てみると、訓練コードが含まれておらず、公開の予定もないそうです。そこで、本記事では、Whisperの解説に加えて、Fine Tuningの方法を解説します。 ※ Fine Tungingを何となくで作成しているので、正確なコードではないです。気付いた点がありましたら、コメントください。全てのコード
Fine-tuning GPT-3.5-Turbo for Natural Language to SQL
- 11 users
- medium.com
- テクノロジー
- 2023/09/01
Photo by Mariia Shalabaieva on UnsplashBackgroundAllowing non-technical users to ask questions from a database has been a problem of interest in academia and industry for years. The recent advances in Large Language Model (LLM) technology, such as GPT-4, have improved the accuracy of proposed solutions. However, since the most advanced LLMs have not been open for fine-tuning, recent work in the sp
Fine-tuning: gpt-3.5-turboの活用事例。絵文字分類タスク改善のプロセスと、学びの言語化。｜にょす
- 11 users
- note.com/nyosubro
- テクノロジー
- 2023/08/31
みなさん、Fine-tuning使ってますか！？一週間ほど前に、OpenAI社からgpt-3.5-turboがFine-tuning可能になったとのアップデートがありましたね。ニュースを見て凄そうと思いつつ、少し作業のハードルがあったり、プロンプトエンジニアリングで事足りてるから、そんなに使わないかも？🤔と思ってました。ただ今回、重い腰を上げて、Fine-tuningを試してみたら、想像以上の結果が得られたので、そのプロセスと学びをまとめます！システムに組み込む際の Prompt Engineering で苦戦している皆さん、Fine-tuningはかなり希望になると思います…！これからはPromptをゴニョゴニョするよりも、Fine-tuningに力を入れていこうと思いました。ではまとめていきます！前置きとこれまでの課題今回は、音声メモ日記アプリ「シャべマル」の絵文字分類タ
- IT
- あとで読む
NN時代のモダンな不均衡データ補正：undersamplingしたデータから得られたモデルを全データでfine-tuningする（論文紹介・ただし再現に失敗） - 渋谷駅前で働くデータサイエンティストのブログ
- 11 users
- tjo.hatenablog.com
- テクノロジー
- 2022/06/09
何だか不均衡データ補正の話題は毎回tmaeharaさんからネタを頂戴している気がしますが（笑）、今回も興味深いネタを拝見したので試してみようと思います。深層学習時代の class imbalance 対応が面白い。適当にバランシングしたデータセットで十分学習した後にフルデータセットでファインチューンするのがいいらしい。なんだこれ。— ™ (@tmaehara) 2022年5月11日端的にまとめると「under/upsamplingで均衡させた改変データセットで学習したNNを、改めて全データセットでfine-tuningすれば不均衡データ補正が上手くいく」という論文があるらしく、しかも割とうまくいくので採用している後発論文が少なからずあるようだ、というお話です。 tmaeharaさんが引用されていたのはこちらの論文なんですが、IEEE公式サイトのものは僕は読めないので適当にarXivで探
- あとで読む
Amazon EC2でDeepSeekをfine-tuningしてみる | DevelopersIO
- 11 users
- dev.classmethod.jp
- テクノロジー
- 2025/01/30
Introduction 現在当たり前になったOpenAI/Anthropic/Google等のLLMですが、ビジネスからプライベートまでどこでも活用されるようになってきました。ChatGPTの登場以降、AIとの対話が当たり前になり、 (私は)LLMがないと仕事ができないほどの状況になっています。そんな中、先日ニュースになったのが、中国のAIスタートアップ「DeepSeek」が開発したモデル「DeepSeek-R1」です。これはOpenAIのo1と同等性能を持つといわれており、OSS(MITライセンス)で公開しています。本稿はDeepSeek-R1モデルをローカル（EC2)で動かしてみた作業ログです。 Local LLM 私の場合、ChatGPTやClaudeをWebブラウザやアプリ、APIを通じて利用しています。これらのサービスは非常に手軽ですが、セキュリティ面での懸念や利用コ
- Fine-tuning
- LLM
- 機械学習
- aws
- AI
DiffusersベースでStable Diffusionをfine tuningする｜Kohya S.
- 11 users
- note.com/kohya_ss
- テクノロジー
- 2022/11/10
NovelAIの提案した学習手法、自動キャプションニング、タグ付け、Windows＋VRAM 12GB（v1.4/1.5の場合）環境等に対応したfine tuningです。 ※12/17：v9に更新しました。「Diffusersの環境構築とスクリプトの準備」に飛んでください。はじめに先日、DiffusersベースでDreamBoothを行う記事を書きましたが、U-Netの学習の仕組みを使うことでStable Diffusionのfine tuningが可能です。この記事ではその方法について解説します。以前のDreamBoothのスクリプトを流用したfine tuningよりも機能が追加されています。ある程度の枚数（数百枚～が望ましいようです）の画像を用意することでDreamBoothよりもさらに柔軟な学習が可能です。 Pythonで仮想環境を構築できるくらいの方を対象にしています。また
WhisperをFine Tuningして専門用語を認識可能にする
- 10 users
- medium.com
- テクノロジー
- 2023/05/22
Whisperを少量のデータセットでFine Tuningして専門用語を認識可能にする方法を解説します。Tacotron2の合成音声でデータセットを作成することで、専門用語を認識可能なWhisperモデルを作成します。 WhisperについてWhisperはOpenAIの開発した音声認識モデルです。日本語を含む多言語に対応しており、高精度な音声認識が可能です。ただし、学習時に使用していない専門用語は認識できないという問題があります。 Whisperのアーキテクチャ（出典：https://huggingface.co/blog/fine-tune-whisper）Whisperにおける専門用語の扱いについてWhisperで専門用語を取り扱う場合、initial_promptに専門用語を埋め込むという方法があります。しかし、initial_promptにはコンテキストサイズの半分の224トーク
Fine-Tuning Llama-2: Tailoring Models to Unique Applications
- 10 users
- www.anyscale.com
- テクノロジー
- 2023/08/12
Fine-Tuning Llama-2: A Comprehensive Case Study for Tailoring Models to Unique Applications In this blog, we provide a thorough analysis and a practical guide for fine-tuning. We examine the Llama-2 models under three real-world use cases, and show that fine-tuning yields significant accuracy improvements across the board (in some niche cases, better than GPT-4). Experiments were carried out with
- 自然言語処理
- 機械学習
GitHub - huggingface/peft: 🤗 PEFT: State-of-the-art Parameter-Efficient Fine-Tuning.
- 10 users
- github.com/huggingface
- テクノロジー
- 2023/02/11
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- あとで読む
LLMのFine-Tuning手法まとめ - Qiita
- 9 users
- qiita.com/mshinoda88
- テクノロジー
- 2023/07/04
パラメータの選択は、PIR の重要なステップで、タスク分析と重要度ランキングを通じて、タスクのパフォーマンスに最も大きな影響を与えるパラメータを特定します。 2-1.PIR を実装する主な方法勾配ベースの重要度ランキング勾配ベースの重要度ランキングは、LLM の各パラメーターに関する損失関数の勾配を計算することによって機能します。パラメーターの勾配は、パラメーターが損失関数にどの程度影響を与えるかを示す尺度で、最も高い勾配を持つパラメーターが最も重要であるとみなされます。ランダムフォレスト重要度ランキングランダムフォレスト重要度ランキングは、LLM のパラメーターでランダムフォレストモデルをトレーニングすることによって機能します。ランダムフォレストモデルの出力を予測するために最も重要なパラメーターは、LLM の最も重要なパラメーターであると考えられます。実際には、
- ai
- あとで読む
Fine-tuning 20B LLMs with RLHF on a 24GB consumer GPU
- 9 users
- huggingface.co
- テクノロジー
- 2023/03/10
We are excited to officially release the integration of trl with peft to make Large Language Model (LLM) fine-tuning with Reinforcement Learning more accessible to anyone! In this post, we explain why this is a competitive alternative to existing fine-tuning approaches. Note peft is a general tool that can be applied to many ML use-cases but it’s particularly interesting for RLHF as this method is
- あとで読む
ChatGPTのfine-tuningで俺botを作ってみた話 - Qiita
- 7 users
- qiita.com/jonesjones
- テクノロジー
- 2024/02/07
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめにこんにちは、そこらへんのデータサイエンティストです。突然ですが、みなさん（特に男性諸君）こんなこと思ったことありませんか？彼女のLINEを返すのがめんどくさい毎朝毎朝、「おはよう」をわざわざLINEで言わなければいけないのが嫌だどうでもいい内容のメッセージに返信するのが億劫だ自分の代わりに返信してくれるbotがあったら便利なのになぁ... と、いうわけで、自分っぽく返信してくれるbot、通称「俺bot」を作ってみることにしました。俺botの作り方ではどうやって俺botを作るのか。実は至って簡単で、誰でも作ることが
続・GPT-4oで画像解析をやってみた Fine-tuning編 - GMOインターネットグループグループ研究開発本部
- 7 users
- recruit.gmo.jp
- テクノロジー
- 2024/10/20
TL;DR OpenAIは2024年10月1日に公開した新しいAPIの１つがVision Fine-tuningです。これはGPT-4oの画像認識能力を追加学習(ファインチューニング)できる新機能です。Vision Fine-tuning APIは、最低10枚の画像と期待する返答の学習データを準備するだけで、Web上で手軽に実行と検証が可能です。今回、実験として美雲このはの画像を使ってキャラクターを認識させたり、問題のあるグラフの可視化を指摘させるなどの学習をさせて、期待通りの回答を得ることができました。なお、人物や顔、CAPTCHAなど利用規約に違反する画像は学習できない点に注意が必要です。はじめにこんにちは、グループ研究開発本部・AI研究室のT.I.です。OpenAIでは、2024年10月1日に、いくつかの新しいAPIをリリースしました。今回のBlogでは、その１つであるvisi
- あとで読む
OpenAIが2つの新機能を発表、モデルのカスタマイズをより容易にー fine-tuning APIの拡張とカスタムモデルプログラムの拡大
- 7 users
- techfeed.io
- テクノロジー
- 2024/04/05
4月5日、OpenAIが新たな機能改善としてfine-tuning APIの拡張とカスタムモデルプログラムの拡大を発表した。 fine-tuning APIの新機能 OpenAIは、GPT-3.5のfine-tuning APIに新しい機能を追加した。このAPIは、ユーザーがモデルの性能を向上させるための手法を提供し、特定のタスクに適したモデルを作成するのに役立つ。例えば、プログラミング言語に特化したコードの生成や、特定の形式でテキストを要約するためのモデルのトレーニング、ユーザーの行動に基づいて個別に作成されたコンテンツの作成などが挙げられる。 fine-tuning APIは、開発者が事前にトレーニングされたモデルを自分のデータに適応させるための柔軟性を提供する。これにより、モデルは特定のタスクやドメインに最適化され、より正確な結果を生成できる。また、このAPIは大規模なトレーニングデ
ChatGPTでファインチューニング (Fine-tuning) を試してみた - PLAY DEVELOPERS BLOG
- 6 users
- developers.play.jp
- テクノロジー
- 2023/11/13
こんにちは、プラットフォーム技術部開発第２グループの李です。最近AIサービスChatGPTがよく注目されます。米国時間2023年8月22日にOpenAIは、大規模言語モデル「GPT-3.5 Turbo」がFine-tuningに対応したと発表しました。 openai.com 今回、このFine-tuningを試してみました。 Fine-tuningとは Fine-tuningのメリットプロンプトよりも高品質な結果が得られるプロンプトに収まりきらないほどの多くの例を学習できる短いプロンプトによるトークンの節約低レイテンシーのリクエスト OpenAI APIを使用したFine-tuningの手順 1. OpenAI APIキーを取得する 2. Fine-tuningの作業環境を準備する 3. トレーニングデータを準備する 4. トレーニングデータのフォーマットをチェックする 5. デ
- ai
Fine-tuning a PyTorch BERT model and deploying it with Amazon Elastic Inference on Amazon SageMaker | Amazon Web Services
- 6 users
- aws.amazon.com
- テクノロジー
- 2020/07/16
AWS Machine Learning Blog Fine-tuning a PyTorch BERT model and deploying it with Amazon Elastic Inference on Amazon SageMaker November 2022: The solution described here is not the latest best practice. The new HuggingFace Deep Learning Container (DLC) is available in Amazon SageMaker (see Use Hugging Face with Amazon SageMaker). For customer training BERT models, the recommended pattern is to use
- BERT
- PyTorch
- AWS
ファインチューニング（Fine-tuning：微調整）とは？
- 6 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2023/01/26
用語「ファインチューニング」について説明。「事前学習」した訓練済みニューラルネットワークモデルの一部もしくは全体を、別のデータセットを使って再トレーニングすることで、新しいタスク向けにモデルのパラメーターを微調整することを指す。連載目次用語解説機械学習（厳密にはニューラルネットワーク）におけるファインチューニング（Fine-tuning：微調整）とは、あるデータセットを使って事前学習（Pre-training）した訓練済みモデルの一部もしくは全体を、別のデータセットを使って再トレーニングすることで、新しいタスク向けに機械学習モデルのパラメーターを微調整することである（図1）。一般的に、再トレーニングの際の学習率はより小さな値にするため、既に調整済みのパラメーターへの影響もより小さなものとなる。ファインチューニングは、（広義の）転移学習（Transfer Learning）の一つのア
- ディープラーニング
Kaggleで学んだBERTをfine-tuningする際のTips⑤〜ラベルなしデータ活用編〜 | 株式会社AI Shift
- 5 users
- www.ai-shift.co.jp
- テクノロジー
- 2023/01/17
こんにちは！AIチームの戸田です！本記事では私がKaggleのコンペティションに参加して得た、Transformerをベースとした事前学習モデルのfine-tuningのTipsを共有させていただきます。以前も何件か同じテーマで記事を書かせていただきました。 Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編 Kaggleで学んだBERTをfine-tuningする際のTips②〜精度改善編〜 Kaggleで学んだBERTをfine-tuningする際のTips③〜過学習抑制編〜 Kaggleで学んだBERTをfine-tuningする際のTips④〜Adversarial Training編〜今回はラベルなしデータの活用について書かせていただきます。世の中の様々な問題を、蓄積された大量のデータを使った教師あり学習で解こうとする試みは多くなされてい
- BERT
- NLP
- *tips
LLMに「自分自身との対戦」で能力を向上させる手法『Self-Play Fine-Tuning（SPIN）』 | AIDB
- 5 users
- ai-data-base.com
- テクノロジー
- 2024/01/11
LLMに自身の出力をアップデートさせ続け、品質を向上させる自己学習手法の一種が考案されました。実験では様々なテストスコアが上昇したとされています。手法の名称は『Self-Play Fine-Tuning（SPIN）』と付けられています。本記事では手法と実験結果を見ていきます。参照論文情報タイトル：Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models 著者：Zixiang Chen, Yihe Deng, Huizhuo Yuan, Kaixuan Ji, Quanquan Gu 所属：カリフォルニア大学 URL：https://doi.org/10.48550/arXiv.2401.01335 コード：https://github.com/uclaml/SPIN データセット：ht
Parameter-Efficient Fine-Tuning using 🤗 PEFT
- 5 users
- huggingface.co
- テクノロジー
- 2023/02/15
Nice work👍 \n","updatedAt":"2025-03-12T14:40:30.506Z","author":{"_id":"66862cd0677f1a2f5f3d07a6","avatarUrl":"https://cdn-avatars.huggingface.co/v1/production/uploads/66862cd0677f1a2f5f3d07a6/99pEoRLwaNt-LW-umcOCJ.jpeg","fullname":"Sachin Murali","name":"sachin6624","type":"user","isPro":false,"isHf":false,"isHfAdmin":false,"isMod":false}},"numEdits":0,"identifiedLanguage":{"language":"en","proba
BERTのfine-tuning不安定性はどのように解決できるか？
- 5 users
- ai-scholar.tech
- 世の中
- 2021/03/03
3つの要点 ✔️ BERT等のTransformerベース事前学習モデルのfine-tuningの不安定性を分析 ✔️ 勾配消失による学習初期の最適化の難しさ、一般化の違いを不安定性の原因として特定 ✔️ fine-tuningの安定性を高める新たなベースラインを提案 On the Stability of Fine-tuning BERT: Misconceptions, Explanations, and Strong Baselines written by Marius Mosbach, Maksym Andriushchenko, Dietrich Klakow (Submitted on 8 Jun 2020 (v1), last revised 6 Oct 2020 (this version, v2)) Comments: Accepted to ICLR2021. Sub