いろいろな大学などでの研究をわかりやすく紹介したり、研究生活のこと・データ解析のことなど書いたり。データ解析手法のプログラムや教科書もnoteで公開しています! データ分析・解析関係の質問、どしどし受け付けております! データ解析をおこなうとき、データセットに欠損値があるときがあります。たとえば、 サンプルAは変数1と変数2の両方に値があり、 サンプルBは変数1に値はあるが変数2には値がなく、 サンプルCは変数2に値はあるが変数1には値がない、 といったときです。エクセルファイルにデータを表示したときに虫食いがあるようなデータセットの状況です。 このような状況ではどうすればよいでしょうか? 実は、これには明確な答えはありません。 しかし、多少わかっていることもあります。 順に説明します。 まず、欠損値のあるサンプルをすべて削除してみる 縦にサンプル、横に変数が並んでいるようなデータセットの