最適な行動が見つかる「動的計画法」、段階を踏めば難しくない

テクノロジーカテゴリーの変更を依頼記事元:

xtech.nikkei.com

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

最適な行動が見つかる「動的計画法」、段階を踏めば難しくない

現在は第3次人工知能（AI）ブームといわれている。このブームの立役者の1つが「強化学習」。本連載は、... 現在は第3次人工知能（AI）ブームといわれている。このブームの立役者の1つが「強化学習」。本連載は、強化学習の基礎から最新の話題まで、分かりやすく解説する。読者の方に技術のエッセンスを直感的に理解してもらい、より専門的な教科書や論文を読みこなせるようになってもらうことが目標である。今回は、前回紹介したQ学習で最適解を導く動的計画法を解説する。前回は強化学習の代表例としてQ学習を紹介しました。Q学習を使うと、特定の環境に置かれた人工知能（エージェント）は、目的を実現するための適切な行動を効率的に学習できる上、ある数学的な条件の下では最適な行動原理、すなわち将来にわたって獲得し得る報酬の合計（収益）を最大にできる方策（Policy）を導けます。 Q学習によって最適な方策を導くことができるのは、その前身となった「動的計画法（DP：Dynamic Programming）」と呼ばれる手法によると

ブックマークしたユーザー

ski_ysk2020/02/22

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx