エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
データ分析や機械学習に欠かせない「前処理」の共通化を目指したオープンソースが国内で発足
オープンデータのフォーマット共通化を目指したプロジェクト http://dataset.jp とそれらのプラクティス... オープンデータのフォーマット共通化を目指したプロジェクト http://dataset.jp とそれらのプラクティスを元にデータの前処理のフレームワーク化を目的としたプロジェクト datakit の2つが発足された 前処理 ■データの前処理 人工知能、ビッグデータの現場において、綺麗に加工されモデリングや分析のアルゴリズムを施せるデータがすぐに手に入る事はほぼあり得ない。 まずは有益なデータソースを探すところから始まり、そのデータを理解しデータフォーマット(配列, データフレーム..)に加工し分析可能なデータの型に変換(例えば男、女という文字列を整数型に変換など)する必要がある。 またそれに加えて外れ値や欠損値、連続値の離散化などのデータの正規化を行わなければ正しい分析をする事は出来ない。 現状、モデリングや分析それ自体に対するフレームワークはオープンソースを含め存在するが、この事前処理を
2017/09/01 リンク