アマゾンで買い物をするとき、購入したサービスや商品の価格を設定したのは、おそらく人間ではなくアルゴリズムだ。自動化システムがますます手ごろで簡単に実装できるようになるにつれ、価格設定アルゴリズムはあらゆるオンライン販売で使われるようになってきた。 航空会社やホテルは長らく機械を使って価格を設定してきたが、価格設定システムは進化しており、ルール・ベースのプログラムから強化学習ベースのプログラムへと移行し、価格を決定するロジックはもはや人間がコントロールするものではなくなった。 強化学習はAI(人工知能)エージェントに対し、特定の目標に向けて罰と報酬を使って動機付けする機械学習のサブセットである。アルファ碁(AlphaGo)が、囲碁で最強の棋士を打ち破るのに強化学習を使ったのは有名だ。価格設定システムは、たとえば、全体的な利益を最大化するなどの目標を与えられ、その後、シミュレーション環境でさま
![強化学習ベースの価格設定アルゴリズムに「談合」の恐れ](https://cdn-ak-scissors.b.st-hatena.com/image/square/95c0cbbbbded56d1a2cad342376a19ead4d82485/height=288;version=1;width=512/https%3A%2F%2Fcdn.technologyreview.jp%2Fwp-content%2Fuploads%2Fsites%2F2%2F2019%2F02%2F13030511%2Famazon-1400x787.png)