[B! 機械学習] s-nanagiのブックマーク

s-nanagi id:s-nanagi

機械学習に関するs-nanagiのブックマーク (2)

強化学習未経験者がテトリスの AI を作ってみた話
はじめにこの度、強化学習によるテトリスの AI を作成してみました。想像以上にうまくいき、最終的には半永久的にラインを消してくれる AI に成長してくれたので、今回はその記録として AI を作成した過程をここに記していきます！今回の AI の概要今回作成したテトリス AI の概要は以下の通りです。特定のゲームの状態から可能な行動パターンを全てシミュレーションする行動後の状態を入力情報として Neural Network に今後の報酬の期待値を推測させる今後の報酬の期待値が一番高くなる行動を実際の行動として選択して遷移する (貪欲方策) Game Over になるまで 1 ~ 3 を繰り返す Tetris AI を可視化した図何も知らない頃は『AI ってどうやって動いてるんだ？』と自分は思っていたんですが、動作原理は非常にシンプルです。強化学習とは、この今後の報酬の期待値を推測
s-nanagi 2024/05/02
機械学習
リンク
Scaled Dot-Product Attentionの本当の凄さを考える
近年、機械学習分野で大きな成果をあげているTransf ormer[1]において、その中核をなすScaled Dot-Product Attention[1]には、革新的な仕組みが備わっています。その仕組みとは、後で詳しく説明しますが、入力に応じて重みを動的に変えることが可能なニューラルネットワークで、これにより驚くほど広範囲で膨大な情報に対する適応性と表現力を実現することができます。本記事では、Scaled Dot-Product Attentionのこの仕組みとその利点について解説し、私なりの解釈を紹介できればと思います。先に結論を簡単にまず、結論から説明すると、Scaled Dot-Product Attentionは、入力に基づいて重みを変えることが可能なニューラルネットワークという解釈が可能です。ただし、Scaled Dot-Product Attentionは学習パラメータを
s-nanagi 2023/07/07
機械学習

AI
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx