Aobeiのブックマーク / 2023年4月22日

Aobei id:Aobei

2023年4月22日のブックマーク (6件)

AIが達人技を体得する技術「敵対的逆強化学習」の紹介 - GMOインターネットグループグループ研究開発本部
イントロダクションみなさま、こんにちは(or こんばんは)。次世代システム研究室のY.Tです。最近は、急に夏から秋にシフトチェンジして温度変化がダイナミックになっていますが、みなさまはお体に気をつけてお過ごしでしょうか？私の方は、温かいお風呂とビタミンCのこまめな摂取でなんとか季節の境目を乗り切ろうと奮闘中です。さて今回は、「敵対的逆強化学習」をテーマとした内容をお届けします。このブログをご覧になる皆様であれば、「強化学習」というキーワードをすでにご存知かもしれません。今回取り上げるのは、逆強化学習のアルゴリズムの一つで、達人の手本を見様見真似で模倣するというものです。どのあたりが「強化学習」の逆なのか、「敵対的」とはどういう忌みなのか、順を追ってご説明したいと思います。世界チャンピオンを越えるAIを作り上げた強化学習。だが・・・みなさんは「Alpha碁」というAIをご
Aobei 2023/04/22
強化学習
リンク
逆強化学習を理解するための強化学習の基礎 - Qiita
1. はじめに逆強化学習の手法についてはこちらを御覧ください。本記事では逆強化学習の手法については解説していません。逆強化学習は、エキスパートの行動から報酬を推定する手法です。例として下図のようなことを実現することが可能になります。 (K.Kitani, et al., 2012, Activity Forecasting, ECCV) この例では、逆強化学習によって人の行動の報酬を推定し、経路予測をしています。一般的に、強化学習ではエージェントが環境から報酬を得ることで最適な行動を学習します。エージェントは環境に行動という形で働きかけ、環境はそれによって変化した状態と状態の価値である報酬をエージェントに渡します。この一連の相互作用を何度も繰り返し、報酬の最大化を目指します。強化学習の課題として、多くのタスクでこの報酬をはっきりと定義することが難しい点が挙げられます。例えば、「車を
Aobei 2023/04/22
強化学習

あとで読む
リンク
【ChatGPT】これだけ覚えればOK？ゴールシークプロンプトが誰でも使えて最強すぎた｜Masaki KANAI
このnoteのターゲットChatGPTを使ってるけど、イマイチ使いこなせていない人 ChatGPTにどんな指示をしていいか迷っている人このnoteで得られることゴールシークプロンプトの概要を理解できるゴールシークプロントの使い方が分かるゴールシークプロンプトとは聞き慣れない単語だと思うので、まずはそれぞれの言葉を説明しますね。 ■ ゴール：AIを使ってユーザーが達成したい目標 ■ シーク：探す, 探し求める ■ プロンプト：AIに指示するために入力する文章つまり、ゴールシークプロンプトとは「ゴールを自ら探しに行ってくれるプロンプト」のことです。ゴールシークプロンプトがすごい理由ゴールシークプロンプトがすごい理由は、以下の３点。 1. 曖昧なゴール設定でも、AIが明確なゴールを探してくれる 2. AIと対話しながらゴールを探せる 3. 汎用性のある形に変更もできる ChatGPTに
Aobei 2023/04/22
ChatGPT

あとで読む
リンク
【ChatGPTとペアプロ】 #1 アイデア出しから設計検討まで - Qiita
概要 ChatGPTとペアプロでアプリを作るのが流行っているのでやってみました。次のような構成を予定しています。【ChatGPTとペアプロ】 #1 アイデア出しから設計検討まで ← いまここ【ChatGPTとペアプロ】 #2 設計検討からモックの作成まで【ChatGPTとペアプロ】 #3 モックの作成から詳細設計まで【ChatGPTとペアプロ】 #4 モックの作成から仕様決定まで【ChatGPTとペアプロ】 #5 仕様決定から開発前提 ChatGPT-4を使用して次の拡張機能を有効にしています。 WebChatGPT Superpower ChatGPT 要求定義最近は共働きの夫婦が多いかと思いますが、仕事・家事・育児が同時並行で進んでいくので大変だと思います。その負担を解消することを今回のアプリの目的にしました。洗い出し負担といっても色々あると思うのでまずは洗い出しで
Aobei 2023/04/22
ChatGPT
リンク
データフレームのままglmnetを使用する - Qiita
set.seed(1) epsilon <- rnorm(10) dat <- data.frame(y = 1:10+epsilon, x1 = rep(1,10), x2 = 1:10, x3 = (1:10)^2)
Aobei 2023/04/22
glmnet

lasso
リンク
話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握する - Qiita
話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握するPDF OpenAI ChatGPTlangchain記事投稿キャンペーン_ChatGPT はじめに本記事では、ChatGPT と LangChain の API を使用して、PDF ドキュメントの内容を自然言語で問い合わせる方法を紹介します。具体的には、PDF ドキュメントに対して自然言語で問い合わせをすると、自然言語で結果が返ってくる、というものです。 ChatGPT と LangChain を使用することで、下記のような複数ステップの仕事を非常に簡単に実行させることができます。 PDF ドキュメントからテキストを抽出して複数に分割する分割したテキストからテキスト間の関連を表すベクターデータを作成する作成したベクターデータをベクターストアに格納しておく ChatGPT に外部から与
Aobei 2023/04/22
ChatGPT
リンク
- 2023年4月23日
- 2023年4月22日
- 2023年4月21日