タグ

Dataに関するyuu_kimyのブックマーク (2)

  • Tensorflow Data Validationを用いた機械学習用データセットの検証方法 - DATAFLUCT Tech Blog

    こんにちは!nakamura(@naka957)です。記事では、TensorFlowの拡張機能であるTensorFlow Data Validationを用いたデータセット検証を行う方法をご紹介します。 データセット検証とは、機械学習モデルの構築時に使う訓練データと運用データの間の違いを調べることです。訓練データと運用データの性質に違いが存在すると、モデル精度の悪化に繋がります。そのため、構築したモデルの精度監視だけでなく、より前工程となるデータセット時点での検証も非常に重要になります。特に、データセットサイズが大きくなるほど、手作業での検証が困難となるため、効率的で自動化された検証方法が求められてきます。 データセット検証を行うライブラリは様々ありますが、今回は機械学習の実装フレームワークとして特に有名なTensorFlow系のライブラリを用いて行います。 では、早速始めていきます。

    Tensorflow Data Validationを用いた機械学習用データセットの検証方法 - DATAFLUCT Tech Blog
  • 重回帰分析の例題サンプルデータ10選 | XICA-Labs

    【分析の意図】 売上に影響する要因を分析することで、なるべく機会損失・廃棄ロスの少ない適切な販売体制を取れるようにしたい。 【目的変数】 アイスクリームの売上 【説明変数】 最高気温 通行人数 【分析の意図】 高田馬場駅の周辺の物件100件を調べ、様々な物件の条件(広さ、駅からの遠さ、階数など)がどれくらい家賃に影響するのかを調べたい。 【目的変数】 物件の家賃 【説明変数】 様々な物件の情報(広さ、駅からの徒歩時間、築年数、階数、様々な設備の有無、etc…)

    重回帰分析の例題サンプルデータ10選 | XICA-Labs
    yuu_kimy
    yuu_kimy 2015/06/19
    ちょっとお試しで使えそうやな..(来週の勉強会に活用活用
  • 1