Your current browser isn't compatible with SoundCloud. Please download one of our supported browsers. Need help?
をプログラムして実験してみた。簡単に言うと、目の前にN本レバーがあるとする。各レバーを引くとお金がもらえるのだが、レバーによってもらえる量にばらつきがある。このとき、どのような方法を取れば最も多くお金がもらえるかという問題。 まずとっさに思いつくのは各レバーを一回ずつ引いて、どのレバーが最もお金をもらえるか調べ、後はずっとそのレバーを引きまくる方法だと思う。これは貪欲法という。でもこの方法には問題点がある。レバーを引くたびにもらえるお金は正規分布に従っていて、ばらつきがあるからである。例えば、レバー3が最も多くもらえると思っていても、実際は、たまたまその一回だけ多かっただけで実際の平均値は少ないかも知れないのだ。 では、どうしたらよいのか。それは、たまに他のレバーをランダムに選んでみればよい。もしかしたら、そのレバーは今まで一番いいと思っていたレバーより、さらに良いものかも知れないからだ。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く