[B! NLP] ymym3412のブックマーク

ymym3412 id:ymym3412

NLPに関するymym3412のブックマーク (204)

Evolutionary Optimization of�Model Merging Recipes (2024/04/17, NLPコロキウム)
Evolutionary Optimization of�Model Merging Recipes (2024/04/17, NLPコロキウム)
ymym3412 2024/04/17
NLP

自然言語処理
リンク
IBIS2023チュートリアル「大規模言語モデル活用技術の最前線」
近年，国内外の企業および研究機関において大規模言語モデルの開発競争が激化している．それに伴い，大規模言語モデルの性能を最大限に引き出すための研究も活発に行われており，大きな発展を見せている．本チュートリアルでは，自身の研究や業務で大規模言語モデルを使いたいと考えている初学者を主な対象とし，Chain of ThoughtやReActを始めとする大規模言語モデルを使うために役立つ技術や知見を最新の研究成果に基づいて紹介する．
ymym3412 2023/10/31
NLP

自然言語処理

機械学習
リンク
OpenAI Cookbook
Processing and narrating a video with GPT's visual capabilities and the TTS API
ymym3412 2023/09/23
自然言語処理

NLP

Deep Learning

chatgpt
リンク
大規模言語モデル
2023年度統計関連学会連合大会チュートリアルセッション　言語モデルと自然言語処理のフロンティア
ymym3412 2023/09/11
NLP

Deep Learning
リンク
LLMOps：基盤モデルに基づくアプリケーション開発のワークフロー｜Weights & Biases Japan
Weights & Biases のnoteをフォローしてください大規模言語モデル（LLM）の可能性を引き出し、その機能を拡張してアプリケーションを開発・提供するためのワークフローは、どのようなものなのでしょうか。私たちはここ数ヶ月、様々な場所でこの課題を耳にしてきました。これまで機械学習モデルの開発と運用を統合するMLOps（Machine Learning Operations）のワークフローの構築において最も信頼されてきたWeights & Biasesは、OpenAIやStability AIなど、生成AIの開発で最先端をいく企業に活用されてきました。この経験をもとに、本稿ではMLOpsのベストプラクティスをレビューし、この概念がどのようにLLMOpsに適用されていくのか、現時点のベストプラクティスを示していきます。特にLLMOpsにおいては、多くの場合社外で開発された基盤モ
ymym3412 2023/07/17
機械学習

自然言語処理

NLP
リンク
GPT-4登場以降に出てきたChatGPT/LLMに関する論文や技術の振り返り - Platinum Data Blog by BrainPad
本記事は、当社オウンドメディア「Doors」に移転しました。約5秒後に自動的にリダイレクトします。このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。この記事では、GPT-4の登場から執筆日（2023年5月31日時点）までの2ヶ月間で登場した論文を振り返りながら、まとめて紹介していきます。 LLM/ChatGPTの動向オープンソースLLM モデルオープンソースLLMの調整 Adapter、LoRA Instruction Tuning Human Feedback プロンプトエンジニアリングプロンプトエンジニアリングの課題①：プロンプトに大量の情報を入れられないプロンプトエンジニアリングの課題②：複雑なタス
ymym3412 2023/06/08
chatgpt

自然言語処理

NLP
リンク
OpenAI Platform
Explore resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's developer platform.
ymym3412 2023/06/07
chatgpt

AI

自然言語処理

NLP
リンク
AI契約審査プラットフォーム「LegalForce」、「ChatGPT」APIを活用した「条文修正アシスト」機能のオープンβ版を提供開始～一定程度の実用にたえうる文案を生成し、契約審査業務のさらなる効率化を支援～ - 株式会社LegalOn Technologies｜リーガルオンテクノロジーズ
2023.5.30 AI契約審査プラットフォーム「LegalForce」、「ChatGPT」APIを活用した「条文修正アシスト」機能のオープンβ版を提供開始～一定程度の実用にたえうる文案を生成し、契約審査業務のさらなる効率化を支援～株式会社LegalOn Techno logies（本社：東京都江東区　代表取締役執行役員CEO：角田望、以下LegalOn Techno logies）は、AI契約審査プラットフォーム「LegalForce」で、生成AI・大規模言語モデルの分野で注目される技術の1つであるAzure OpenAI Serviceで提供される「ChatGPT」APIを活用し、契約書の修正をサポートする「条文修正アシスト」機能のオープンβ版を5月30日（火）より提供開始いたします。本機能の搭載により、「LegalForce」での契約審査業務のさらなる効率化を支援します。この度、
ymym3412 2023/05/30
NLP

自然言語処理
リンク
生成AI周回遅れキャッチアップ勉強会！
社内勉強会からの抜粋資料です。
ymym3412 2023/05/13
AI

NLP

自然言語処理
リンク
0421DS協会_ChatGPTによって描かれる未来とAI開発の変遷.pdf
発表動画はこちら。 https://youtu.be/l9fpxtz22JU 2023/4/29 一部修正とAPIに関するページ追加 2023/5/11 ChatGPTの言葉の意味を補足する資料を追加。Azure OpenAI Serviceで使えるモデルの記載を一部修正・最新情報追記。 202…
ymym3412 2023/04/22
NLP

自然言語処理

Deep Learning
リンク
[輪講資料] LoRA: Low-Rank Adaptation of  Large Language Models
パラメータを固定した事前学習済みモデルに対して、ごく少数のパラメータからなる低ランク行列を導入・学習することで、モデル全体のfine-tuningと同等の性能を発揮できる手法であるLoRAと、その論文について解説した資料です。深層学習を用いた自然言語処理の歴史的な変遷と周辺技術から、LoRAが必要と…
ymym3412 2023/04/19
NLP

自然言語処理

機械学習

Deep Learning
リンク
RNNでTransformer並みの性能を実現するRWKVがやばい
(本記事は数時間前からRWKVの手法について調べ始めた著者が、手法をまとめるためのメモ書きとして深夜テンション書いたレベルのものです。内容の正確さについて保証しないので各自最後にある参考文献の確認をお願いします。日本語の記事でRWKVの手法について解説されたものが見当たらなかったので、一部僕の見解が含まれますが英語版中国語版の翻訳程度に受け取ってもらえたら幸いです。中国語は一切読めないけど・・・） Introduction 昨今の生成系AIブームの中で、OpenAIが開発するChatGPT、特にGPT4の性能は目を引くものがあります。ですが、そのモデルを動かすための計算資源にも目を引くものがあり、LLaMA.cppなどローカルで動かそうとする試みは存在するにせよ、やはり一般の家庭でしかも現実的な電気代でGPT4を動かすという未来は遠そうです。さて、そんな話題のChatGPTやGPT4です
ymym3412 2023/04/18
自然言語処理

NLP

Deep Learning
リンク
大規模言語モデルの驚異と脅威
2022年11月にOpen AIが公開したChatGPTが世界で注目を集めている。一般ドメインかつ多言語で、従来のチャットボットとはレベルの異なる高品質の対話をリアルタイムに実現するサービスを（Research Preview版ではあるが）無料で提供し、検索、金融、広告、教育、法務などの広範囲な分野の転…
ymym3412 2023/03/28
chatgpt

NLP

自然言語処理
リンク
宮脇+'23 - Prompt Engineering サーベイ
・「Prompt Engineering 勉強会 / 2023.03.21 GPT-4 Prompt 報告会」を更新しました（最終更新日 2023.04.22）・本資料は勉強会用に作成した突貫的な資料で絶賛 WIP であり随時更新していこうと思います。・誤りなどありましたらご指摘ください。
ymym3412 2023/03/25
chatgpt

NLP

自然言語処理
リンク
Alpaca まとめ｜npaka
「Alpaca」の学習方法について軽くまとめました。 1. Alpaca「Alpaca」は、「LLaMA 7B」(Meta)をファインチューニングした言語モデルです。「text-davinci-003」による「self-instruct」で生成された52Kの命令追従型の学習データを使って学習しています。「Alpaca」はOpenAIの「text-davinci-003」に似た挙動を示しますが、驚くほど小さく再現が容易で安価であることが特徴です。また、「Alpaca」は学術研究のみを目的としており、商用利用は禁止しています。 2. 学習済み言語モデルと学習データアカデミックな予算で高品質な言語モデルを学習させるためには、「強力な学習済み言語モデル」と「高品質な学習データ」が必要です。 1つ目は、最近リリースされたMetaの「LLaMA」で解決されます。2つ目は、「self-instru
ymym3412 2023/03/23
NLP

自然言語処理

chatgpt
リンク
手元で動く軽量の大規模言語モデルを日本語でファインチューニングしてみました(Alpaca-LoRA)｜masa_kazama
イントロ最近、ChatGPTやGPT-4などの大規模言語モデル(LLM)が急速に注目を集めています。要約タスクや質疑応答タスクなど様々なタスクで高い性能を発揮しています。これらのモデルはビジネス分野での応用が非常に期待されており、GoogleやMicrosoftが自社サービスとの連携を進めているという報道も相次いでいます。今回は、手元で動作する軽量な大規模言語モデル「Alpaca-LoRA」を日本語にファインチューニングしてみました。この記事では、そのファインチューニングのプロセスや応用例について簡単に解説していきます。ChatGPTやGPT-4は、モデルがブラックボックスでありAPI経由でしか入力を与えて出力を得ることができません。さらに、現時点（2023年3月20日）では、独自のデータを用いてファインチューニングを行うこともできません。しかし、Alpaca-LoRAというモデルを用
ymym3412 2023/03/20
AI

chatgpt

NLP

自然言語処理

機械学習
リンク
Alpaca-loraを日本語タスクでファインチューニングする - Qiita
Alpaca-LoRAという家庭用GPUでも大規模言語モデルのFineTuningが可能なモデルが発表されました。本記事では、livedoorニュースコーパスを使用してAlpaca-LoRAをFineTuningしてニュースのタイトルを考えさせるというタスクに挑戦してみます。技術の概要 Alpacaとは Alpacaとは、先日Metaが発表したLLaMa 7Bをtext-davinci-003によるself-instructで生成されたデータを使用してFineTuningした言語モデル。生成したデータは52K個で生成コストは500ドル以下と低コストです。人間による予備評価では7Bという比較的小さなモデルにも関わらず、text-davinci-003に似た挙動を示すという報告があげられています。 Alpaca-LoRAとは Alpaca-LoRAとはAlpacaで作成したデータセット
ymym3412 2023/03/20
NLP

自然言語処理

機械学習

chatgpt
リンク
https://twitter.com/bukuta_3/status/1636834862505275393?t=cE_FLZokFnBCcxSNkwu8Kg&s=09
ymym3412 2023/03/19
NLP

自然言語処理

chatgpt
リンク
Prompt Engineering Guide – Nextra
Prompt Engineering Guide Prompt engineering is a relatively new discipline for developing and optimizing prompts to efficiently use language models (LMs) for a wide variety of applications and research topics. Prompt engineering skills help to better understand the capabilities and limitations of large language models (LLMs). Researchers use prompt engineering to improve the capacity of LLMs on a
ymym3412 2023/03/18
NLP

自然言語処理

chatgpt
リンク
GPT-4はどのようにして「不適切な回答」を回避するように学習されているのか - Qiita
先日OpenAIより発表されたGPT-4が話題ですが、同タイミングで公表されたTechnical Reportを読んでみたところ、全99ページのうち後半60ページを占めるドキュメント「GPT-4 System Card」において解説されていた、言語AIが抱える危険性と、いかにしてGPT-4が危険な回答を回避するように学習されているかについての内容が非常に興味深かったため、簡単にまとめてみました。 https://arxiv.org/pdf/2303.08774.pdf サマリ GPT-4のリリースに向けて、OpenAIでは安全性を評価するために50人超の専門家らを含む"レッドチーム"を結成。2022年8月から8ヶ月に渡ってリスクの評価とその軽減に向けたチューニングを実施してきたリスク評価における実験の中には「自身をコピーするプログラムを実行できるGPT-4が自己増殖をしないか確認する」と
ymym3412 2023/03/18
自然言語処理

NLP
リンク
1 2 3 4 5 6 7 8 9 10 次のページ