タグ

2023年4月22日のブックマーク (6件)

  • AIが達人技を体得する技術「敵対的逆強化学習」の紹介 - GMOインターネットグループ グループ研究開発本部

    イントロダクション みなさま、こんにちは(or こんばんは)。 次世代システム研究室のY.Tです。 最近は、急に夏から秋にシフトチェンジして温度変化がダイナミックになっていますが、みなさまはお体に気をつけてお過ごしでしょうか? 私の方は、温かいお風呂とビタミンCのこまめな摂取でなんとか季節の境目を乗り切ろうと奮闘中です。 さて今回は、「敵対的逆強化学習」をテーマとした内容をお届けします。 このブログをご覧になる皆様であれば、「強化学習」というキーワードをすでにご存知かもしれません。 今回取り上げるのは、逆強化学習のアルゴリズムの一つで、達人の手を見様見真似で模倣するというものです。 どのあたりが「強化学習」の逆なのか、「敵対的」とはどういう忌みなのか、順を追ってご説明したいと思います。 世界チャンピオンを越えるAIを作り上げた強化学習。だが・・・ みなさんは「Alpha碁」というAIをご

    AIが達人技を体得する技術「敵対的逆強化学習」の紹介 - GMOインターネットグループ グループ研究開発本部
  • 逆強化学習を理解するための強化学習の基礎 - Qiita

    1. はじめに 逆強化学習の手法についてはこちらを御覧ください。記事では逆強化学習の手法については解説していません。 逆強化学習は、エキスパートの行動から報酬を推定する手法です。例として下図のようなことを実現することが可能になります。 (K.Kitani, et al., 2012, Activity Forecasting, ECCV) この例では、逆強化学習によって人の行動の報酬を推定し、経路予測をしています。 一般的に、強化学習ではエージェントが環境から報酬を得ることで最適な行動を学習します。エージェントは環境に行動という形で働きかけ、環境はそれによって変化した状態と状態の価値である報酬をエージェントに渡します。この一連の相互作用を何度も繰り返し、報酬の最大化を目指します。 強化学習の課題として、多くのタスクでこの報酬をはっきりと定義することが難しい点が挙げられます。例えば、「車を

    逆強化学習を理解するための強化学習の基礎 - Qiita
  • 【ChatGPT】これだけ覚えればOK?ゴールシークプロンプトが誰でも使えて最強すぎた|Masaki KANAI

    このnoteのターゲットChatGPTを使ってるけど、イマイチ使いこなせていない人 ChatGPTにどんな指示をしていいか迷っている人 このnoteで得られることゴールシークプロンプトの概要を理解できる ゴールシークプロントの使い方が分かる ゴールシークプロンプトとは聞き慣れない単語だと思うので、まずはそれぞれの言葉を説明しますね。 ■ ゴール:AIを使ってユーザーが達成したい目標 ■ シーク:探す, 探し求める ■ プロンプト:AIに指示するために入力する文章 つまり、ゴールシークプロンプトとは「ゴールを自ら探しに行ってくれるプロンプト」のことです。 ゴールシークプロンプトがすごい理由ゴールシークプロンプトがすごい理由は、以下の3点。 1. 曖昧なゴール設定でも、AIが明確なゴールを探してくれる 2. AIと対話しながらゴールを探せる 3. 汎用性のある形に変更もできる ChatGPT

    【ChatGPT】これだけ覚えればOK?ゴールシークプロンプトが誰でも使えて最強すぎた|Masaki KANAI
  • 【ChatGPTとペアプロ】 #1 アイデア出しから設計検討まで - Qiita

    概要 ChatGPTとペアプロでアプリを作るのが流行っているのでやってみました。 次のような構成を予定しています。 【ChatGPTとペアプロ】 #1 アイデア出しから設計検討まで ← いまここ 【ChatGPTとペアプロ】 #2 設計検討からモックの作成まで 【ChatGPTとペアプロ】 #3 モックの作成から詳細設計まで 【ChatGPTとペアプロ】 #4 モックの作成から仕様決定まで 【ChatGPTとペアプロ】 #5 仕様決定から開発 前提 ChatGPT-4を使用して次の拡張機能を有効にしています。 WebChatGPT Superpower ChatGPT 要求定義 最近は共働きの夫婦が多いかと思いますが、仕事・家事・育児が同時並行で進んでいくので大変だと思います。その負担を解消することを今回のアプリの目的にしました。 洗い出し 負担といっても色々あると思うのでまずは洗い出しで

    【ChatGPTとペアプロ】 #1 アイデア出しから設計検討まで - Qiita
  • データフレームのままglmnetを使用する - Qiita

    set.seed(1) epsilon <- rnorm(10) dat <- data.frame(y = 1:10+epsilon, x1 = rep(1,10), x2 = 1:10, x3 = (1:10)^2)

    データフレームのままglmnetを使用する - Qiita
  • 話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握する - Qiita

    話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握するPDFOpenAIChatGPTlangchain記事投稿キャンペーン_ChatGPT はじめに 記事では、ChatGPT と LangChain の API を使用して、PDF ドキュメントの内容を自然言語で問い合わせる方法を紹介します。 具体的には、PDF ドキュメントに対して自然言語で問い合わせをすると、自然言語で結果が返ってくる、というものです。 ChatGPT と LangChain を使用することで、下記のような複数ステップの仕事を非常に簡単に実行させることができます。 PDF ドキュメントからテキストを抽出して複数に分割する 分割したテキストからテキスト間の関連を表すベクターデータを作成する 作成したベクターデータをベクターストアに格納しておく ChatGPT に外部から与

    話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握する - Qiita