エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【初心者】モデリング用のデータをサニタイズおよび準備を整理してみた - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【初心者】モデリング用のデータをサニタイズおよび準備を整理してみた - Qiita
背景・目的 私は、現在データエンジニアリングを生業としています。普段は、データ基盤の構築や、パフォ... 背景・目的 私は、現在データエンジニアリングを生業としています。普段は、データ基盤の構築や、パフォーマンスチューニングなどビックデータに関する業務に従事しています。 ビックデータの収集や、蓄積、分析などの環境構築の経験はそこそこありますが、機械学習による予測や分類などのスキルは持ち合わせていませんでした。 今まで機械学習を避け続けてきましたが、一念発起し学ぼうと思います。 学び方としては、AWS Certified Machine Learning – Specialty(以降、ML試験という。)の勉強を通して、理解を深めていきます。 今回は、モデリング用のデータをサニタイズおよび準備について学習します。 まとめ 機械学習では、事前のデータセットの把握やサニタイズが十分に必要。 データの把握では、以下のような方法を用いる。 列と行の数を把握 多変量統計により、属性間の相関を把握 属性統計に