ビニング処理(ビン分割)とは、連続値を任意の境界値で区切りカテゴリ分けして離散値に変換する処理のこと。機械学習の前処理などで行われる。 例えば、年齢のデータを10代、20代の層(水準)ごとに分けるといった処理などがある。 pandasでビニング処理(ビン分割)を行うにはpandas.cut()またはpandas.qcut()を使う。 pandas.cut — pandas 0.22.0 documentation pandas.qcut — pandas 0.22.0 documentation それぞれ、 等間隔または任意の境界値でビン分割: cut() 要素数が等しくなるようにビン分割: qcut() という違いがある。 ここでは、pandas.cut()およびpandas.qcut()の使い方として、以下の内容を説明する。 等間隔または任意の境界値でビニング処理: cut() 最大値