タグ

2023年2月14日のブックマーク (18件)

  • 【論文解説】OpenAI 「GPT」を理解する

    (以下は Transformer を理解している必要がありますので、まだの方はスキップしていただいても構いません) まずは、単語の位置情報を表す Positional Encoding です。 もとの Transformer と同じで、単語の埋め込み表現に位置情報を足します。 $$\begin{align} h_0 = UW_e + W_p \end{align}$$ \(W_e\)が単語の埋め込み表現の行列、\(W_p\)が位置情報を埋め込む行列です。 ただし、GPTでは、\(W_p\) はオリジナルの Transformer の論文のように \(\sin\)・\(\cos\) を使った方法ではなく、\(W_p\) もデータから学習します。 次のレイヤーですが、Transformer と言っても、ここでは encoder-decoder を使った Transformer ではなく、dec

    【論文解説】OpenAI 「GPT」を理解する
    gabill
    gabill 2023/02/14
  • 【論文解説】OpenAI 「GPT-3」を理解する

    今回は、LINEによる汎用的な超巨大言語モデルの開発の話題もあり、GPT-2以上に話題になっているOpenAI GPT-3について解説したいと思います。 結構長い論文ですが、論文の最後の方の内容も非常に興味深い内容になっている論文ですので、最後まで読んでいただけると幸いです。 特に「Synthetic and Qualitative Tasks」の節は驚きの結果になっています。 なお、2023年3月には GPT-4 が公表されましたので、こちらも参考にしていただければと思います。 『【論文解説】GPT-4 を理解する』 GPT-3とは ではまずGPT-3の特徴を簡単に説明します。 GPT3はOpenAIから2020年に以下の論文で発表されました。 『Language Models are Few-Shot Learners』 GPT、GPT-2に続く3番目のモデルですが、モデルの仕組み自体

    【論文解説】OpenAI 「GPT-3」を理解する
    gabill
    gabill 2023/02/14
  • 【自然言語処理】日本語GPT-2モデルをファインチューニングして文章生成をやってみる

    はじめに 2022年11月にOpenAIが公開したchatGPTの反響が凄いですね。 公開6日目にして100万人がユーザー登録したとか。 今のところは、無料で使うことができますが、いずれは利用が制限されるかもしれませんね。 ここでは、chatGPTよりは精度が落ちますが、無料で使うことができて、日語に特化した事前学習済みモデルもあるGPT-2を採り上げ、文章生成にチャレンジしたいと思います。 具体的にはrinna社が開発したGPT-2モデルを使用します。 事前学習済みモデルだけでもそれなりの文章を生成できますが、せっかくなので、特定のドメインでファインチューニングさせてみて、文章生成をしていきたいと思います。 rinna社の日語GPT-2の特徴 言語モデルは、会話や文章の「人間が使う言葉」を確率としてモデル化したものです。優れた言語モデルとは、確率を正確に推定できるものを指します。例え

    【自然言語処理】日本語GPT-2モデルをファインチューニングして文章生成をやってみる
    gabill
    gabill 2023/02/14
  • Azure OpenAI Service のドキュメント - クイックスタート、チュートリアル、API リファレンス - Azure AI サービス

    Azure OpenAI Service のドキュメント Azure OpenAI Service により、Azure のセキュリティとエンタープライズ機能を備えた GPT-4、GPT-4 Turbo with Vision、GPT-3.5-Turbo、DALLE-3、Embeddings モデル シリーズを含む OpenAI のモデルにアクセスできます。

    Azure OpenAI Service のドキュメント - クイックスタート、チュートリアル、API リファレンス - Azure AI サービス
    gabill
    gabill 2023/02/14
  • Azure OpenAI Service を使用してモデルをカスタマイズする方法 - Azure OpenAI

    Azure OpenAI Service を使用すると、"微調整" と呼ばれるプロセスを使用して、個人用データセットに合わせてモデルを調整できます。 このカスタマイズ手順では以下が提供されて、サービスをさらに活用できるようになります。 プロンプト デザインからだけでは得られないより高品質な結果 プロンプトでは対応できないほど多くの例を使ってトレーニングする機能 待機時間の短い要求 カスタマイズしたモデルは、特定のプロンプトと構造でモデルの重みをトレーニングすることで、少数の学習アプローチで改善されます。 カスタマイズしたモデルにより、プロンプトで例を示さずに、より多くのタスクでより良い結果を得られます。 その結果、送信されるテキストや API 呼び出しごとに処理されるトークンが少なくなり、コストが節約され、要求の待機時間が短縮されます。 前提条件 Azure サブスクリプション - 無料ア

    Azure OpenAI Service を使用してモデルをカスタマイズする方法 - Azure OpenAI
    gabill
    gabill 2023/02/14
  • GPT-3 の分類のファインチューニングを試す|npaka

    GPT-3」の分類のファインチューニングを試したのでまとめました。 1. OpenAI APIOpenAI API」は、OpenAIの最新の深層学習モデルにアクセスすることができるクラウドサービスです。「GPT-3」を利用するには「OpenAI API」経由でアクセスする必要があります。 2. 利用料金「GPT-3」にはモデルが複数あり、性能と価格が異なります。Ada は最速のモデルで、Davinci は最も精度が高いモデルになります。価格は 1,000トークン単位です。 「ファインチューニング」には、TRAININGとUSAGEという2つの価格設定があります。TRAININGのトークン数は、データセット内のトークン数と、エポック数(デフォルト4)によって決まります。 TRAININGのトークン数 = データセット内のトークン数 x エポック数 USAGEのトークン数 = プロンプトの

    GPT-3 の分類のファインチューニングを試す|npaka
    gabill
    gabill 2023/02/14
  • JSON Lines

    Documentation for the JSON Lines text file format This page describes the JSON Lines text format, also called newline-delimited JSON. JSON Lines is a convenient format for storing structured data that may be processed one record at a time. It works well with unix-style text processing tools and shell pipelines. It's a great format for log files. It's also a flexible format for passing messages bet

    gabill
    gabill 2023/02/14
  • 実践GPT-3シリーズ② ファインチューニングにより精度向上するのか? - AI事業 - マクニカ

    こんにちは、AIエンジニアの佐々木です。 前回はアド・ジェネレーターを使ってエンジンやパラメータの違いによるアウトプットの変化について解説しました。 前回記事:実践GPT-3シリーズ① アド・ジェネレータの作成 実践GPT-3シリーズ 2 回目の今回は、昨年からサービスが始まったファインチューニングについて、使い方や学習曲線の確認方法、そしてファインチューニングしない場合とした場合とでの精度の違いを、IMDb (Internet Movie Database) 映画レビューの感情分類を例に解説します。 要約 ファインチューニングによって最大 33 ポイントの精度向上が見られた ファインチューニングステップはとてもシンプル Weights & Biases でファインチューニングの学習曲線が確認できる 推論時のプロンプトは Zero-Shot で OK 目次 ファインチューニングとは IMD

    実践GPT-3シリーズ② ファインチューニングにより精度向上するのか? - AI事業 - マクニカ
    gabill
    gabill 2023/02/14
  • GPT-3におけるFew-Shot・Zero-Shot

    膨大なパラメータを持つ言語モデルであるGPT-3は、学習後にパラメータを更新することなくタスクの情報と少量のデモンストレーションを入力することで、様々なNLPタスクをこなすことができます。論文のタイトルに含まれる「Few-Shot Learners」というフレーズもこれを意図したものだと言えます。 論文ではZero/One/Few-Shotという概念に触れられていますが、これらの説明が自分の理解していた内容と違っていました。結論から言えば、GPT-3におけるZero/One/Few-Shotと、一般に紹介されている(と思う)Zero/One/Few-Shot learningは大きく異なります。稿ではGPT-3におけるこれらの説明と、他の資料での説明を比較し内容を整理します。 GPT-3によるマルチタスク処理の仕組み GPT-3がパラメータの更新なしに様々なタスクを処理する仕組み自体は、

    GPT-3におけるFew-Shot・Zero-Shot
    gabill
    gabill 2023/02/14
  • 30分で完全理解するTransformerの世界

    はじめに 初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータAI技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。 深層学習界隈では、2017年に衝撃的なタイトル(Attention Is All You Need)の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transformer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。 今回はそんなTransformerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transformers に倣いつつ、適宜、2023年2月上旬現在ま

    30分で完全理解するTransformerの世界
    gabill
    gabill 2023/02/14
    AIがプログラミングを勉強するとプログラミング以外の分野でも賢くなるって説は面白い。
  • AI搭載の新「Bing」を使って実感--大勢が「ググる」から「ビグる」に乗り換える可能性

    マイクロソフトの進化した検索サービス「Bing」を試してみた。昨年末から、OpenAIが提供する「ChatGPT」が話題だ。一方のBingはCharGPTをベースにマイクロソフトが持つ技術と融合することで、使いやすい「検索サービス」に生まれ変わっている。 ひょっとすると、検索王者であるグーグルの立場を脅かすのではないか、という期待感に満ちている。最近、IT関連で熱狂するニュースがなくて飽き飽きしていたが、新しいBingはIT業界の構造がひっくり返るのではないかとワクワクが止まらない。 新しいBingはチャット形式の検索サービスだ。 これまでの検索と言えば、思いつく単語をいくつか入力し、検索で出てきた複数のサイトから、自分が知りたい情報が載っていそうなタイトルをクリックして、文を読んで答えを導き出していくというものであった。 新しいBingでもそうした検索は可能だ。さらに「チャット」という

    AI搭載の新「Bing」を使って実感--大勢が「ググる」から「ビグる」に乗り換える可能性
    gabill
    gabill 2023/02/14
    ビンググる
  • Windows 10上の「IE11」、2月14日で完全無効化 Edgeに強制リダイレクトへ

    Windows 10に搭載されているWebブラウザ「Internet Explorer 11」(IE11)が2月14日で完全無効化された。同社の最新ブラウザ「Edge」へ強制リダイレクトされる。IE11は2022年6月16日をもってサポート終了となっていたが、これまでアプリケーション自体は立ち上げることができた。 6月13日に配信予定のWindowsセキュリティ更新プログラムでは、スタートメニューやタスクバー上のIE11アイコンなども削除する。なお、EdgeにはInternet Explorerをエミュレートする「IEモード」が搭載されており、こちらは「少なくとも2029年まで」サポートするとしている。 関連記事 さようなら、全てのインターネット・エクスプローラー 6月16日、Windows用のウェブブラウザーである「Internet Explorer」(IE)が、ついに最後の日を迎えた。

    Windows 10上の「IE11」、2月14日で完全無効化 Edgeに強制リダイレクトへ
    gabill
    gabill 2023/02/14
  • ChatGPTはWebのボケたJPEGである|Yossarian

    はじめに映画化もされた「あなたの人生の物語」(映画化時のタイトルは「メッセージ」でした。監督はドゥニ・ヴィルヌーヴ)などの作品で知られるSF小説家であるテッド・チャン氏が最近著しく話題のChatGPTに関する解説をNEW YORKER誌に寄せました。 適切ではないかもしれない、としながらもChatGPTを非可逆画像圧縮であるJPEGに喩えた内容となっています。個人的にはAI質をついているような気もしました。 とても素晴らしい内容ですのでDeepLで翻訳し、若干おかしな訳に手を加えた内容を皆さんと共有します。(文の改変はしていませんが、個人的に気になった箇所のみ太字としています。私見は訳注として与えております。) ChatGPT Is Blurry JPEG of the Web By Ted Chiang February 9, 2023 文12013年、ドイツのある建設会社の社員

    ChatGPTはWebのボケたJPEGである|Yossarian
    gabill
    gabill 2023/02/14
    こうなったらAIは本から学ぶことをやめて自分の目と耳で体験したことから学ぶしかない。
  • core-js/docs/2023-02-14-so-whats-next.md at master · zloirock/core-js

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    core-js/docs/2023-02-14-so-whats-next.md at master · zloirock/core-js
    gabill
    gabill 2023/02/14
  • 島根県:2月8日質問項目2(トップ / 県政・統計 / 政策・財政 / 広聴・広報 / 丸山知事記者会見 / 令和4年度)

    2.新型コロナウイルス感染症 ○NHK:NHKの猪俣です。お願いします。 先ほどお話があったと思うんですけれども、コロナのワクチンが、まさに秋冬、今日の厚労省の部会で示されたということで、重症化リスクの方には追加の接種も留意するというようなことも含まれていますけれども、経済とは別に、安全面ですとか、そういうところから見て、知事、この国の方針というのをどういうふうに受け止めてらっしゃるでしょうか。 ○丸山知事:5類にしたらコロナがなくなるとか、何かそんな末転倒な発想になっているんじゃないかという気がしますけど。マスクの話も含めて、自分で感染自体を避けるとか、感染しても大ごとにならないという、我々が選択できるツールをやらなくていいとか、できないようにするとか、何かそんなことを一生懸命考えておられるけど、当に責任が取れるような範囲、責任を問われるようなことになるんじゃないかっていう危惧はあり

    gabill
    gabill 2023/02/14
  • ラックが社内基幹システム刷新を中止、18億円超の特損計上で最終赤字に

    ラックは2023年2月13日、社内基幹システムの開発を中止したことにより、2022年4~12月期の連結決算で18億2000万円の特別損失を計上したと発表した。2023年3月期の業績予想を見直し、最終損益は14億1000万円の黒字予想から一転、3億円の赤字に転落する見通しだ。 同社は2018年から、新たな社内基幹システムの企画・開発を進め、2020年10月の運用開始を目指していた。2012年に統合した旧ラック、システム開発のエー・アンド・アイ システム、システム販売のアイティークルーがそれぞれ運用していたシステムを統合・刷新する狙いだった。しかし、追加開発などが発生し、求める機能が十分に得られないと判断し、開発を中止した。今後、新システムとして再構築する。 社内基幹システムの開発中止などに伴い、2022年4~12月期の純損益は10億5000万円の赤字になった。

    ラックが社内基幹システム刷新を中止、18億円超の特損計上で最終赤字に
    gabill
    gabill 2023/02/14
  • Bing AIのチャットができること|品田遊(ダ・ヴィンチ・恐山)

    Chat GPTをさらに進化させた、Bingに搭載されるチャットAI機能を先行で体験したので、いろいろ使ってみた。情報収集よりも文章形成が中心です。 2023/2/18 追記:アップデートが入ったので現在はできなくなってることも多々あるみたいです。 比較表ハムスターとiPhoneの比較ジョークを考える弁護士に厳しい怖すぎる俳句ドクロ俳句 ドクロハンバーガー俳句 漫才コロナ禍漫才ロールプレイ高飛車な女の子紹介文グラビアアイドル風の武田信玄グラビアアイドル風の卑弥呼裁判ゲーム陰謀論地球平面論者のロールプレイ指示した話を膨らませて書くチャーハンを捨てる話SS天海春香と櫻木真乃の対話碇親子の会話おじさん構文 このあと「iPhoneをあげるよ」としつこかった思想のトレースラップバトル「お前はただの曲がった果物」ジョークの解説批判的な検討非現実的な前提からのシミュレートアスキーアートシナリオの中間を考

    Bing AIのチャットができること|品田遊(ダ・ヴィンチ・恐山)
    gabill
    gabill 2023/02/14
  • 【特集】 5年で廃れた電池、今のオモシロ電池、未来の電池ってどんなもの? ~知ってるようで知らない、酒の席のネタになる電池のお話

    【特集】 5年で廃れた電池、今のオモシロ電池、未来の電池ってどんなもの? ~知ってるようで知らない、酒の席のネタになる電池のお話
    gabill
    gabill 2023/02/14