タグ

ゲームとAIに関するgo5025のブックマーク (4)

  • ディープマインドの新AI、スタークラフトでプロゲーマーに初勝利

    アルファベット(グーグル)の人工知能AI)専門子会社であるディープマインドが、新たな快挙を発表した。銀河戦争で人間を打ち負かしたのだ。 ディープマインドの最新学習アルゴリズムである「アルファスター(AlphaStar)」は、スタークラフト2のプロプレイヤーたちに初勝利を収めた。プロゲーマーのTLOとMaNaに対し、10勝1敗の対戦成績を挙げたのだ。この人気のリアルタイムの戦略ゲームでは、プレイヤーは3つの種族のうちの1つとして戦い、建物を建てたり、だだっ広い戦場で戦闘を繰り広げたりする。 アルファスターは、アルファスター・リーグと呼ばれる環境の中でゲームの仕方を学習した。最初に、大規模なニューラル・ネットワークが熟練者によるゲームの再現を観察した。その後、強化学習と呼ばれる機械学習の手法を使って、自らの分身を相手に戦うことで次第に腕を上げていく。ここで重要なのは、アルファスターのアクショ

    ディープマインドの新AI、スタークラフトでプロゲーマーに初勝利
  • 朝日新聞デジタル:電王戦ソフト破りボナンザV コンピュータ将棋選手権 - カルチャー

    【深松真司】将棋ソフトの強さを競う第23回世界コンピュータ将棋選手権が3〜5日、東京都新宿区の早稲田大学で開かれ、ソフト「ボナンザ」が7年ぶり2回目の優勝を果たした。  プロ棋士とソフトが戦った第2回電王戦に出場した4ソフトを含む計40ソフトが参加。予選を勝ち抜いた上位8ソフトが総当たりの決勝を戦った。最後までもつれる展開になり、ボナンザが最終局、電王戦で三浦弘行八段に勝った「GPS将棋」に時間切れで勝ち、優勝を決めた。  ボナンザは電気通信大特任助教の保木邦仁さん(37)が開発。2005年に登場してプログラムの設計図を公開したことで将棋ソフト全体の開発・進化に貢献した。07年には渡辺明竜王と対戦して話題になった。 関連記事将棋電王戦、最終局もソフト勝利 プロ棋士、団体戦敗北(4/20)プロとコンピューターは引き分け 将棋電王戦第4局(4/13)1秒に2億手読んでV コンピュータ将棋選手権

  • コンピューター将棋 世界一を競う NHKニュース

    将棋のコンピューターソフトの世界一を競う大会が東京で開かれ、プロの棋士が思いつかないような斬新な一手が繰り出される熱戦が展開されました。 ことしで23回目となる大会には、将棋のソフトを開発した日アメリカの合わせて40チームが参加し、5日は予選を勝ち抜いた8チームが総当たりの決勝に臨みました。 対局に使われるコンピューターは1秒間に数千万から数億の局面を計算できるということで、各チームは持ち時間の25分を最大限使って最善の一手を探ります。 会場では、プロの棋士による解説も行われ、集まった将棋ファンたちはプロも思いつかない斬新な手が次々と繰り出される対局を熱心に観戦していました。 将棋のソフトは、およそ40年前に開発が始まりましたが、ここ数年、コンピューターの性能やプログラムの技術の向上で格段に強くなり、ことし3月から先月まで行われた現役のプロ棋士との対局では、コンピューター側の3勝1敗1

  • 『【DiGRA公開講座】モンテカルロ木探索とは何か?』

    将棋と比べて囲碁の評価関数を難しくしているのは、 ・将棋の駒は種類ごとに機能と優劣に差があるが、囲碁の石にはそれがない。 ・リバーシにおける角のように、明らかな特徴を持った場所が少ない。 ・支配領域の広さを基準としても、領域が確定するのはゲーム終了時になる。 ・局所的な最善手が全体の最善手ではなく、相手に取らせるためにわざと置く「捨石」というテクニックが常套となっている。 などの点で、さらに上級者の間でしか理解できないような評価基準が存在する。 ・石の厚い薄い 石の厚みは物理的厚さではなく、ある石の配置が全局的に与える影響のこと。 ・形の良し悪し 複数の石の配置の評価。良い形になるように、悪い形にならないように注意することにより、「打ち筋が良くなる」効果がある。ただし「愚形の妙手」も多数存在する。 「代表的な悪い形」 ┼┼┼┼┼┼ ┼┼●┼┼┼ ┼┼●●┼┼ アキ三角 ┼┼┼┼┼┼ ┼┼●

    『【DiGRA公開講座】モンテカルロ木探索とは何か?』
  • 1