タグ

2024年5月1日のブックマーク (4件)

  • 強化学習未経験者がテトリスの AI を作ってみた話

    はじめに この度、強化学習によるテトリスの AI を作成してみました。想像以上にうまくいき、最終的には半永久的にラインを消してくれる AI に成長してくれたので、今回はその記録として AI を作成した過程をここに記していきます! 今回の AI の概要 今回作成したテトリス AI の概要は以下の通りです。 特定のゲームの状態から可能な行動パターンを全てシミュレーションする 行動後の状態を入力情報として Neural Network に今後の報酬の期待値を推測させる 今後の報酬の期待値が一番高くなる行動を実際の行動として選択して遷移する (貪欲方策) Game Over になるまで 1 ~ 3 を繰り返す Tetris AI を可視化した図 何も知らない頃は『AI ってどうやって動いてるんだ?』と自分は思っていたんですが、動作原理は非常にシンプルです。強化学習とは、この今後の報酬の期待値を推測

    強化学習未経験者がテトリスの AI を作ってみた話
    matarillo
    matarillo 2024/05/01
    おおすごい。テトリミノの速度アップ(左右の端に移動させきる前に着地することもある)に対応するのはどのくらい大変だろう
  • プレミアムプランの状態管理と決済ハンドリングの難しさ|tsusowake

    はじめにこんにちは、PIVOTでソフトウェアエンジニアをしている裾分です。PIVOTは2024年2月にアプリ・Webを格始動しました。私はPIVOTにジョインして以降、サブスクリプション機能の開発をしてきたので設計の概要と決済プラットフォームが係る実装の難しさについてまとめてみました。 題冒頭のリリースの通り、PIVOTはYouTubeからプロダクトに集中するにあたり、サブスクリプション機能をリリースしています。 サブスクリプションを実装するにあたり考慮すべき点として、以下の状態を考慮する必要があります。 自サービスで管理する状態 ユーザーのサブスクリプション ユーザーのプラン 他サービスで管理する状態 ユーザーへの課金を行うプラットフォームに登録されているサブスクリプションの状態 決済状態(成功 | 失敗 | …) PIVOTの場合では、決済プラットフォームとして App Store

    プレミアムプランの状態管理と決済ハンドリングの難しさ|tsusowake
    matarillo
    matarillo 2024/05/01
    世のモデリング例って、「きれいなモデル」のことが多いので、複雑だったり泥臭かったりする定義は参考になる。cf https://b.hatena.ne.jp/entry/s/www.yamarkz.com/blog/payment-status-definition-optimal-solution
  • JavaScript: 最初の 20 年 (翻訳) - inzkyk.xyz

    翻訳について これは Allen Wirfs-Brock, Brendan Eich 著 JavaScript: the first 20 years の翻訳です。英語版は CC BY 4.0 ライセンスで公開されています。 この翻訳は CC BY 4.0 ライセンスの許諾に基づいて公開されます。 PDF/EPUB 版について この翻訳の PDF/EPUB 版を BOOTH で販売しています。

    JavaScript: 最初の 20 年 (翻訳) - inzkyk.xyz
    matarillo
    matarillo 2024/05/01
    すごい読み応え。仕様策定におけるチャンピオン(支持者)モデルがES6の議論の中で採用され、その後TC39標準プロセスになったというのもふむふむ。
  • Identify the Champion

    Oscar NierstraszProfessor emeritus @ U Bern. Soul polisher @ feenk.com This paper was originally published in 2000, in Pattern Languages of Program Design 4 and is also available as PDF. The markdown source for this page is available on GitHub. Identify the Champion: An Organisational Pattern Language for Programme Committees (1)Oscar Nierstrasz, Software Composition Group, University of Berne (2)

    matarillo
    matarillo 2024/05/01
    チャンピオンを特定せよ:プログラム委員会のための組織パターン・ランゲージ