タグ

2023年5月15日のブックマーク (2件)

  • 無目的な行動と合目的的な行動と - まとまらない雑感 - 天国と地獄の間の、少し地獄寄りにて

    山登りらしい山登りをやめてから20年以上になる。ピッケルだとかクライミング用のロープだとか山だとかは、結婚したときに捨てた。命を危険にさらすことができる立場ではなくなったと覚悟を決めたからだ。ただ、実質的にはその数年前からそういった道具類を使うことは絶えてなくなっていた。時間がなかったからでもあるし、大学山岳部が衰退してそちらから合宿に参加を求められることもなくなったからでもある。ある意味、ちょうどいいときにやめていたのかもしれない。というのは、おそらく、体力的には山登りをやめる直前の30代なかばまでの頃がピークだったからだ。 実際、あの頃は、いま思えばバケモノ並みに体力があった。条件のいい残雪期とはいえ白馬岳から唐松岳、鹿島槍ヶ岳を経て扇沢までの40km、高低差9千メートルぐらいはある行程を山スキーを履いて2泊3日で走破したのなんか、ちょっとアタマおかしいんちゃうかと冷静になれば思う。

    無目的な行動と合目的的な行動と - まとまらない雑感 - 天国と地獄の間の、少し地獄寄りにて
    arajin
    arajin 2023/05/15
    “目標のない人生、行きあたりばったりの人生では、人はたいしたことを達成できない。けれど同時に、目標や作戦に縛られた人生は、その合理性が連れて行ってくれる場所にしか人を運ばない。”
  • 平均代入法による欠損データ処理はオワコンどころか黒歴史なので

    野村総合研究所の塩崎氏と広瀬氏の記事*1がまた*2データ分析者に困惑を引き起こしている。「データが欠損している場合は、平均値や中央値で埋め合わせる作業を行います。」とあるのだが、欠損データ処理としてはよくない手法として知られている。 平均代入法は、欠損が完全にランダムに生じている(MCAR)とき以外は推定量にバイアスが入ると説明されることが多いが、MCARでも回帰分析などの推定に用いる場合はバイアスが入る。また、単一代入法になるので、標準誤差が過小推定される*3。名前がついているぐらい一般的なのだが、使ってはいけない過去の遺物だ。 推定前の処理としては、欠損データ列がある行を分析から除くリストワイズ法や、分析に用いる欠損データ列がある行を分析から除くペアワイズ法の方がまだよい*4。サンプルサイズの減少を避けたい場合は、単一代入法でも回帰代入などを使う方が望ましい。最近は、機械学習の前処理と

    平均代入法による欠損データ処理はオワコンどころか黒歴史なので