データの可視化に於いて重宝されるグラフの一つに「箱ひげ図」というものがあります。 箱ひげ図 - Wikipedia データの四分位点、中央値、最大値、最小値を記載するのでデータの分布が一覧できるというものです。 しかし箱ひげ図には重大な問題があります。 先ずはプロットしてみる Rがあれば誰でも持っているアヤメのデータを使います。 ”がく”の長さを取り出して箱ひげ図にしてみます。 当然、最大値と四分位点、最小値と四分位点の間にもデータはあるのですが、箱が四分位点で終わってしまっているため、あたかもそこにはデータが無いような印象ではないでしょうか? そこでバイオリンプロット そんな箱ひげ図よりも便利な図としてバイオリンプロットというものが存在します。 ヒストグラムを縦にしたようなもので、これであればデータの凡その分布もわかります 箱ひげ図と比較してみる こちらのサイトを参考にさせて頂きました。