タグ

2019年6月12日のブックマーク (3件)

  • 強化学習 - Wikipedia

    強化学習(きょうかがくしゅう、英: reinforcement learning、RL)は、ある環境内における知的エージェントが、現在の状態を観測し、得られる収益(累積報酬)を最大化するために、どのような行動をとるべきかを決定する機械学習の一分野である。強化学習は、教師あり学習、教師なし学習と並んで、3つの基的な機械学習パラダイムの一つである。 強化学習が教師あり学習と異なる点は、ラベル付きの入力/出力の組を提示する必要がなく、最適でない行動を明示的に修正する必要もない。その代わり、未知の領域の探索と、現在の知識の活用の間のバランスを見つけることに重点が置かれる[1]。 この文脈の強化学習アルゴリズムの多くは動的計画法を使用するため、この環境は通常マルコフ決定過程(MDP)として定式化される[2]。古典的な動的計画法と強化学習アルゴリズムとの主な違いは、後者はMDPの正確な数学的モデルの

    強化学習 - Wikipedia
    komure0709
    komure0709 2019/06/12
    MDPやマルコフ決定過程で日本で求人検索しても、キーエンスしか見つからない。米国だと結構出てくる。
  • AI考案のTV通販番組 セオリー無視で電話3割増 - 日本経済新聞

    「まずい、もう1杯!」のCMで青汁というヒット商品を生んだキューサイ(福岡市)。かつての印象的なセリフに代わり、今や同社の顧客獲得をけん引しているのは人工知能AI)だ。NTTデータと開発したAIが導き出した構成でテレビショッピングの映像を制作し、電話問い合わせ数を従来比で約3割伸ばした。AIテレビショッピング映像の制作にかかわった商品は、「ひざサポートコラーゲン」。ひざ関節の曲げ伸ばしが気

    AI考案のTV通販番組 セオリー無視で電話3割増 - 日本経済新聞
  • 新卒でパナソニックに6年勤めましたがまだ退職しません

    http://blog.yuryu.jp/2012/05/blog-post.html この記事でパナソニック退職した話を見たので。 微妙に現状と違うところがあったので、ちょっと書いてみます。 当時とは状況も違うしね。 お前は誰だパナソニックに勤務するメカ屋です。 学歴は偏差値55程度の東北の駅弁国立大出身。 同期はMARCH以上がデフォなので、少数派だと思う。 といっても、〇芝や〇菱と違って学閥は感じられないのでほとんど影響はないんだと思う。 学部生は、主務昇進前の同期横並びになってる時期は、院卒の2年遅れ。 あとは様々。実力(いつ昇格研修に推薦されるか)次第 年収・残業についてお賃金は昨年(入社5年目時点)で600万円ちょいでした。 入社3年目くらいまでは夜10時くらいまで働くことも多かったけど、働き方改革の旗印のもと、8時以降の残業が禁止になり、定時日が週1設定され、 40時/月以

    新卒でパナソニックに6年勤めましたがまだ退職しません