タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

プロセスに関するkidotakaのブックマーク (2)

  • 機械学習・AIプロジェクトの要素を整理する手法をまとめてみました - Qiita

    機械学習AIプロジェクトを始めたり進めたりするのに,いわゆる "PoC祭り" になってしまうことがありますが,何とか回避できないかといろんな人たちが分析・コミュニケーション手法を作っていますので少し調べてみました.たぶん網羅はしていないのでその点はご容赦ください. 海外の手法 The Machine Learning Canvas 公開の日付が見つけられませんでしたが,たぶん老舗です.書籍なども出ているようです. ぱっと見でどこに何を書くのか分かりにくいですが,要素は充実しています.明らかに技術者寄りの作りになっています. 後で出てくる「機械学習キャンバス」もそうですが,初期の手法は非MLとの比較が含まれているのが面白いです. 出典: Machine Learning Canvas — Louis Dorard AI Project Canvas 要素数や配置を含め,ほとんどビジネスモ

    機械学習・AIプロジェクトの要素を整理する手法をまとめてみました - Qiita
  • 【データ分析】新規データを受領したら最初にすべき10ステップ - Qiita

    はじめに 新規データを受領した際に、統計モデリングや機械学習の前に実施すべき10ステップをまとめてみました すぐにモデリングや機械学習による予測・分類をしたくなりますが、間違えた分析結果や作業の手戻りを避ける為に基的な下記ステップをまず実施することが重要と思います データ型の確認 データ形の変換(日付型) データ形の変換(カテゴリ型の作成) 基統計量の算出 単変量データの可視化 異常値の置換・除去 欠損値の補完・除去 相関(数値×数値)の可視化:ペアプロット&相関行列 相関(数値×カテゴリ)の可視化:ボックスプロット 相関(カテゴリ×カテゴリ)の可視化:ヒートマップ 対象データ概要 今回はサンプルとして下記のようなデータを対象にします 有名なTitanicのデータを加工しました(オリジナルデータは現実には存在しないくらい綺麗だったので) こちらのデータを参考に10ステップを紹介していこ

    【データ分析】新規データを受領したら最初にすべき10ステップ - Qiita
  • 1