gabillのブックマーク / 2023年2月14日

【論文解説】OpenAI 「GPT」を理解する

(以下は Transf ormer を理解している必要がありますので、まだの方はスキップしていただいても構いません) まずは、単語の位置情報を表す Positional Encoding です。もとの Transf ormer と同じで、単語の埋め込み表現に位置情報を足します。 $$\begin{align} h_0 = UW_e + W_p \end{align}$$ $W_e$が単語の埋め込み表現の行列、$W_p$が位置情報を埋め込む行列です。ただし、GPTでは、$W_p$ はオリジナルの Transf ormer の論文のように $\sin$・$\cos$ を使った方法ではなく、$W_p$ もデータから学習します。次のレイヤーですが、Transf ormer と言っても、ここでは encoder-decoder を使った Transf ormer ではなく、dec

gabill 2023/02/14

リンク

【論文解説】OpenAI 「GPT-3」を理解する

今回は、LINEによる汎用的な超巨大言語モデルの開発の話題もあり、GPT-2以上に話題になっているOpenAI GPT-3について解説したいと思います。結構長い論文ですが、論文の最後の方の内容も非常に興味深い内容になっている論文ですので、最後まで読んでいただけると幸いです。特に「Synthetic and Qualitative Tasks」の節は驚きの結果になっています。なお、2023年3月には GPT-4 が公表されましたので、こちらも参考にしていただければと思います。『【論文解説】GPT-4 を理解する』 GPT-3とはではまずGPT-3の特徴を簡単に説明します。 GPT3はOpenAIから2020年に以下の論文で発表されました。『Language Models are Few-Shot Learners』 GPT、GPT-2に続く3番目のモデルですが、モデルの仕組み自体

gabill 2023/02/14

リンク

【自然言語処理】日本語GPT-2モデルをファインチューニングして文章生成をやってみる

はじめに 2022年11月にOpenAIが公開したchatGPTの反響が凄いですね。公開6日目にして100万人がユーザー登録したとか。今のところは、無料で使うことができますが、いずれは利用が制限されるかもしれませんね。ここでは、chatGPTよりは精度が落ちますが、無料で使うことができて、日本語に特化した事前学習済みモデルもあるGPT-2を採り上げ、文章生成にチャレンジしたいと思います。具体的にはrinna社が開発したGPT-2モデルを使用します。事前学習済みモデルだけでもそれなりの文章を生成できますが、せっかくなので、特定のドメインでファインチューニングさせてみて、文章生成をしていきたいと思います。 rinna社の日本語GPT-2の特徴言語モデルは、会話や文章の「人間が使う言葉」を確率としてモデル化したものです。優れた言語モデルとは、確率を正確に推定できるものを指します。例え

gabill 2023/02/14

リンク

Azure OpenAI Service のドキュメント - クイックスタート、チュートリアル、API リファレンス - Azure AI サービス

Azure OpenAI Service のドキュメント Azure OpenAI Service により、Azure のセキュリティとエンタープライズ機能を備えた GPT-4、GPT-4 Turbo with Vision、GPT-3.5-Turbo、DALLE-3、Embeddings モデルシリーズを含む OpenAI のモデルにアクセスできます。

gabill 2023/02/14

リンク

Azure OpenAI Service を使用してモデルをカスタマイズする方法 - Azure OpenAI

Azure OpenAI Service を使用すると、"微調整" と呼ばれるプロセスを使用して、個人用データセットに合わせてモデルを調整できます。このカスタマイズ手順では以下が提供されて、サービスをさらに活用できるようになります。プロンプトデザインからだけでは得られないより高品質な結果プロンプトでは対応できないほど多くの例を使ってトレーニングする機能待機時間の短い要求カスタマイズしたモデルは、特定のプロンプトと構造でモデルの重みをトレーニングすることで、少数の学習アプローチで改善されます。カスタマイズしたモデルにより、プロンプトで例を示さずに、より多くのタスクでより良い結果を得られます。その結果、送信されるテキストや API 呼び出しごとに処理されるトークンが少なくなり、コストが節約され、要求の待機時間が短縮されます。前提条件 Azure サブスクリプション - 無料ア

gabill 2023/02/14

リンク

GPT-3 の分類のファインチューニングを試す｜npaka

「GPT-3」の分類のファインチューニングを試したのでまとめました。 1. OpenAI API「OpenAI API」は、OpenAIの最新の深層学習モデルにアクセスすることができるクラウドサービスです。「GPT-3」を利用するには「OpenAI API」経由でアクセスする必要があります。 2. 利用料金「GPT-3」にはモデルが複数あり、性能と価格が異なります。Ada は最速のモデルで、Davinci は最も精度が高いモデルになります。価格は 1,000トークン単位です。「ファインチューニング」には、TRAININGとUSAGEという2つの価格設定があります。TRAININGのトークン数は、データセット内のトークン数と、エポック数(デフォルト4)によって決まります。 TRAININGのトークン数 = データセット内のトークン数 x エポック数 USAGEのトークン数 = プロンプトの

gabill 2023/02/14

リンク

JSON Lines

Documentation for the JSON Lines text file format This page describes the JSON Lines text format, also called newline-delimited JSON. JSON Lines is a convenient format for storing structured data that may be processed one record at a time. It works well with unix-style text processing tools and shell pipelines. It's a great format for log files. It's also a flexible format for passing messages bet

gabill 2023/02/14

リンク

実践GPT-3シリーズ②　ファインチューニングにより精度向上するのか？ - AI事業 - マクニカ

こんにちは、AI エンジニアの佐々木です。前回はアド・ジェネレーターを使ってエンジンやパラメータの違いによるアウトプットの変化について解説しました。前回記事：実践GPT-3シリーズ①　アド・ジェネレータの作成実践GPT-3シリーズ 2 回目の今回は、昨年からサービスが始まったファインチューニングについて、使い方や学習曲線の確認方法、そしてファインチューニングしない場合とした場合とでの精度の違いを、IMDb (Internet Movie Database) 映画レビューの感情分類を例に解説します。要約ファインチューニングによって最大 33 ポイントの精度向上が見られたファインチューニングステップはとてもシンプル Weights & Biases でファインチューニングの学習曲線が確認できる推論時のプロンプトは Zero-Shot でＯＫ目次ファインチューニングとは IMD

gabill 2023/02/14

リンク

GPT-3におけるFew-Shot・Zero-Shot

膨大なパラメータを持つ言語モデルであるGPT-3は、学習後にパラメータを更新することなくタスクの情報と少量のデモンストレーションを入力することで、様々なNLPタスクをこなすことができます。論文のタイトルに含まれる「Few-Shot Learners」というフレーズもこれを意図したものだと言えます。論文ではZero/One/Few-Shotという概念に触れられていますが、これらの説明が自分の理解していた内容と違っていました。結論から言えば、GPT-3におけるZero/One/Few-Shotと、一般に紹介されている（と思う）Zero/One/Few-Shot learningは大きく異なります。本稿ではGPT-3におけるこれらの説明と、他の資料での説明を比較し内容を整理します。 GPT-3によるマルチタスク処理の仕組み GPT-3がパラメータの更新なしに様々なタスクを処理する仕組み自体は、

gabill 2023/02/14

リンク

30分で完全理解するTransformerの世界

はじめに初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI 技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。深層学習界隈では、2017年に衝撃的なタイトル（Attention Is All You Need）の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transf ormer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。今回はそんなTransf ormerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transf ormers に倣いつつ、適宜、2023年2月上旬現在ま

gabill 2023/02/14

AIがプログラミングを勉強するとプログラミング以外の分野でも賢くなるって説は面白い。

リンク

AI搭載の新「Bing」を使って実感--大勢が「ググる」から「ビグる」に乗り換える可能性

マイクロソフトの進化した検索サービス「Bing」を試してみた。昨年末から、OpenAIが提供する「ChatGPT」が話題だ。一方のBingはCharGPTをベースにマイクロソフトが持つ技術と融合することで、使いやすい「検索サービス」に生まれ変わっている。ひょっとすると、検索王者であるグーグルの立場を脅かすのではないか、という期待感に満ちている。最近、IT関連で熱狂するニュースがなくて飽き飽きしていたが、新しいBingはIT業界の構造がひっくり返るのではないかとワクワクが止まらない。新しいBingはチャット形式の検索サービスだ。これまでの検索と言えば、思いつく単語をいくつか入力し、検索で出てきた複数のサイトから、自分が知りたい情報が載っていそうなタイトルをクリックして、本文を読んで答えを導き出していくというものであった。新しいBingでもそうした検索は可能だ。さらに「チャット」という

gabill 2023/02/14

ビンググる

リンク

Windows 10上の「IE11」、2月14日で完全無効化　Edgeに強制リダイレクトへ

Windows 10に搭載されているWebブラウザ「Internet Explorer 11」（IE11）が2月14日で完全無効化された。同社の最新ブラウザ「Edge」へ強制リダイレクトされる。IE11は2022年6月16日をもってサポート終了となっていたが、これまでアプリケーション自体は立ち上げることができた。 6月13日に配信予定のWindows セキュリティ更新プログラムでは、スタートメニューやタスクバー上のIE11アイコンなども削除する。なお、EdgeにはInternet Explorerをエミュレートする「IEモード」が搭載されており、こちらは「少なくとも2029年まで」サポートするとしている。関連記事さようなら、全てのインターネット・エクスプローラー 6月16日、Windows用のウェブブラウザーである「Internet Explorer」（IE）が、ついに最後の日を迎えた。

gabill 2023/02/14

リンク

ChatGPTはWebのボケたJPEGである｜Yossarian

はじめに映画化もされた「あなたの人生の物語」（映画化時のタイトルは「メッセージ」でした。監督はドゥニ・ヴィルヌーヴ）などの作品で知られるSF 小説家であるテッド・チャン氏が最近著しく話題のChatGPTに関する解説をNEW YORKER誌に寄せました。適切ではないかもしれない、としながらもChatGPTを非可逆画像圧縮であるJPEGに喩えた内容となっています。個人的にはAIの本質をついているような気もしました。とても素晴らしい内容ですのでDeepLで翻訳し、若干おかしな訳に手を加えた内容を皆さんと共有します。（本文の改変はしていませんが、個人的に気になった箇所のみ太字としています。私見は訳注として与えております。） ChatGPT Is Blurry JPEG of the Web By Ted Chiang　February 9, 2023 本文１2013年、ドイツのある建設会社の社員

gabill 2023/02/14

こうなったらAIは本から学ぶことをやめて自分の目と耳で体験したことから学ぶしかない。

リンク

core-js/docs/2023-02-14-so-whats-next.md at master · zloirock/core-js

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

gabill 2023/02/14

リンク

島根県：２月８日質問項目２（トップ / 県政・統計 / 政策・財政 / 広聴・広報 / 丸山知事記者会見 / 令和４年度）

２．新型コロナウイルス感染症 ○ＮＨＫ：ＮＨＫの猪俣です。お願いします。先ほどお話があったと思うんですけれども、コロナのワクチンが、まさに秋冬、今日の厚労省の部会で示されたということで、重症化リスクの方には追加の接種も留意するというようなことも含まれていますけれども、経済とは別に、安全面ですとか、そういうところから見て、知事、この国の方針というのをどういうふうに受け止めてらっしゃるでしょうか。 ○丸山知事：５類にしたらコロナがなくなるとか、何かそんな本末転倒な発想になっているんじゃないかという気がしますけど。マスクの話も含めて、自分で感染自体を避けるとか、感染しても大ごとにならないという、我々が選択できるツールをやらなくていいとか、できないようにするとか、何かそんなことを一生懸命考えておられるけど、本当に責任が取れるような範囲、責任を問われるようなことになるんじゃないかっていう危惧はあり

gabill 2023/02/14

リンク

ラックが社内基幹システム刷新を中止、18億円超の特損計上で最終赤字に

ラックは2023年2月13日、社内基幹システムの開発を中止したことにより、2022年4～12月期の連結決算で18億2000万円の特別損失を計上したと発表した。2023年3月期の業績予想を見直し、最終損益は14億1000万円の黒字予想から一転、3億円の赤字に転落する見通しだ。同社は2018年から、新たな社内基幹システムの企画・開発を進め、2020年10月の運用開始を目指していた。2012年に統合した旧ラック、システム開発のエー・アンド・アイシステム、システム販売のアイティークルーがそれぞれ運用していたシステムを統合・刷新する狙いだった。しかし、追加開発などが発生し、求める機能が十分に得られないと判断し、開発を中止した。今後、新システムとして再構築する。社内基幹システムの開発中止などに伴い、2022年4～12月期の純損益は10億5000万円の赤字になった。

gabill 2023/02/14

リンク

Bing AIのチャットができること｜品田遊（ダ・ヴィンチ・恐山）

Chat GPTをさらに進化させた、Bingに搭載されるチャットAI機能を先行で体験したので、いろいろ使ってみた。情報収集よりも文章形成が中心です。 2023/2/18 追記：アップデートが入ったので現在はできなくなってることも多々あるみたいです。比較表ハムスターとiPhoneの比較ジョークを考える弁護士に厳しい怖すぎる俳句ドクロ俳句ドクロハンバーガー俳句漫才コロナ禍漫才ロールプレイ高飛車な女の子紹介文グラビアアイドル風の武田信玄グラビアアイドル風の卑弥呼裁判ゲーム陰謀論地球平面論者のロールプレイ指示した話を膨らませて書くチャーハンを捨てる話SS天海春香と櫻木真乃の対話碇親子の会話おじさん構文このあと「iPhoneをあげるよ」としつこかった思想のトレースラップバトル「お前はただの曲がった果物」ジョークの解説批判的な検討非現実的な前提からのシミュレートアスキーアートシナリオの中間を考

gabill 2023/02/14

リンク

【特集】 5年で廃れた電池、今のオモシロ電池、未来の電池ってどんなもの？～知ってるようで知らない、酒の席のネタになる電池のお話

gabill 2023/02/14

リンク

はてなブックマーク

タグ

2023年2月14日のブックマーク (18件)

【論文解説】OpenAI 「GPT」を理解する

【論文解説】OpenAI 「GPT-3」を理解する

【自然言語処理】日本語GPT-2モデルをファインチューニングして文章生成をやってみる

Azure OpenAI Service のドキュメント - クイックスタート、チュートリアル、API リファレンス - Azure AI サービス

Azure OpenAI Service を使用してモデルをカスタマイズする方法 - Azure OpenAI

GPT-3 の分類のファインチューニングを試す｜npaka

JSON Lines

実践GPT-3シリーズ②　ファインチューニングにより精度向上するのか？ - AI事業 - マクニカ

GPT-3におけるFew-Shot・Zero-Shot

30分で完全理解するTransformerの世界

AI搭載の新「Bing」を使って実感--大勢が「ググる」から「ビグる」に乗り換える可能性

Windows 10上の「IE11」、2月14日で完全無効化　Edgeに強制リダイレクトへ

ChatGPTはWebのボケたJPEGである｜Yossarian

core-js/docs/2023-02-14-so-whats-next.md at master · zloirock/core-js

島根県：２月８日質問項目２（トップ / 県政・統計 / 政策・財政 / 広聴・広報 / 丸山知事記者会見 / 令和４年度）

ラックが社内基幹システム刷新を中止、18億円超の特損計上で最終赤字に

Bing AIのチャットができること｜品田遊（ダ・ヴィンチ・恐山）

【特集】 5年で廃れた電池、今のオモシロ電池、未来の電池ってどんなもの？～知ってるようで知らない、酒の席のネタになる電池のお話

お知らせ

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

今週のはてなブックマーク数ランキング（2024年7月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス