中央値ではなく「外れ値」で戦う生成AIのテクノロジーのベースにあるのは統計です。ある質問を受けた時に言語生成AIであるChatGPTは、仮想空間にある情報を探索して、最も出現率の高い回答から順に答えていくことをやっているわけです。 質問する側が意図的に探索空間を限定しない限り、ChatGPTはネットの仮想空間において「統計的に最も頻繁に出てくる答え」を回答として出してくる。だから最も標準的な回答を知りたいときは、ChatGPTに聞けばいいのです。 言い換えると、ChatGPTは統計でいう正規分布グラフの山の一番高い部分、つまり両端から数えてちょうど真ん中のところ、「中央値」を答えとして出すということです。統計の中央値ですから、往々にして「それはわかるけど、まあ当たり前だよね」といった内容になりがちです。 これに対して統計的に出現率の低い、正規分布グラフの山の低い両端の部分を「外れ値」と言い