[B! Blog][blog] [3ページ] stryhのブックマーク

stryh id:stryh

Blogとblogに関するstryhのブックマーク (43)

Murayama blog.
強化学習 - Tic-Tac-Toe 三目並べ、マルバツゲーム、Tic-Tac-Toeというそうです。強化学習（Q-Learning）のまとめとしてチャレンジしてみました。Googleで「Tic-Tac-Toe」と検索すると三目並べで遊べます。先に結果ランダムな相手（後手）には80%近い確率で勝てるようになりました。でも実際に対戦してみると「ちょっとかしこいかな？」くらいの印象です。今日の勢いで作ったのでプログラムの細かいところに不備があるかも？しれません。。あまり参考にならないかも。設定などアルゴリズム Q-Learning 報酬勝ち：1 負け：-1 引き分け：0 引き分けも多いので、報酬としてプラスマイナスがあるのも良いのかも。状態 3**9 = 19683とおり行動 9マスあるので9とおりキーボード入力時は0〜8 既に入力済みの場所を選択した場合は、ランダムで配置する
stryh 2008/05/15
Blog
リンク
IT戦記
みなさんお元気ですか？僕は少しだけ元気ではありません。じんわりとした夏の暑さを感じながらブログを書いています。実は、数ヶ月前にスマートニュースという会社を退職しました。しばらく無職しばらくは就職せずに無職でいようかなと思っています。すぐに再就職した方がいいんだろうな〜。とは思うのですが少し疲れたかも。いい時代になったものだ最近は AI の進化も素晴らしく、昔ソフトウェアで出来なかったことがどんどんできるようになってるなって感じます。 Rust とか、ちょうど欲しかった感じのプログラミング言語もあるし、 ChatGPT は完璧ではないけど何か新しいことを始めるときに素晴らしい洞察を与えてくれる。時代は確実に良くなってる。そんな時代に「自分は働いていないくていいのか」と少し不安になるけれど、自由気ままにコードを書く、そんな時間が今あってのもいいのかなって思ってます。オフトピック
stryh 2008/05/15
Blog
リンク
拡張現実ライフ
2024夏休み旅行　神戸・2日目【前編】 zfinchyan.hatena blog.com ↑１日目はこちら 6:50 わたしと夫だけ先に起床前日に買っておいたお芋のパンで朝ごはん昨日の疲れからか、なかなか息子たちが起きてこなかったので、ゆっくり寝かせてから10:00にホテルの下にあるプレイゾーンに行って、パターゴルフやバス…
stryh 2008/05/15
Blog
リンク
前のページ 1 2 3