[B! *algorithm][gcloud] [2ページ] sh19910711のブックマーク

sh19910711 id:sh19910711

*algorithmとgcloudに関するsh19910711のブックマーク (23)

DataflowとTFRecordでシームレスなMLパイプライン構築
最近では、機械学習を用いた事例が徐々に聞かれるようになってきました。しかし、MLエンジニアの方々からは「モデルを作ったはいいが、プロダクションに持っていくのは難しい」という声をよくいただきます。この要因は様々ですが、システムとして考慮しなければならない構成が多いというのが主だった要因になっています。モデルはシステム全体のごく一部（黒い四角部分）中でも特にMLエンジニアを悩ませるのは、データの前処理ではないでしょうか？機械学習では学習と推論時にデータを入力する必要がありますが、プロダクション時のデータは取得してそのままモデルに入力することはできません。なぜなら、データには欠損があるかもしれないし、画像ならモデルに合わせてサイズや階調を変える必要があるからです。さらに、これらのデータが大量にある場合は、１台のマシンでは処理しきれなくなるため、分散環境を構築する必要があります。そして、将来どこ
sh19910711 2018/11/27
Apache Beamでtfrecords出力できる

*data

*infra

gcloud

*algorithm

機械学習

*program

python
リンク
BigQuery ML を使ってみた話 - Speaker Deck
Machine Learning Casual Talks #6 (https://mlct.connpass.com/event/94911/) での発表資料です． BigQuery ML の説明と，実サービスに導入した事例についての紹介を致しました．
sh19910711 2018/11/25
*data

gcloud

warehouse

*algorithm

機械学習
リンク
「BigQueryML」でSQLを書いて機械学習モデルを構築&予測できる！ - Qiita
BigQuery上でpythonなどを使わずにSQLを用いてそのまま機械学習を回せるBigQueryMLという機能がベータ版で出ました！公式のチュートリアルを回してみて、かなり手軽に機械学習モデルを回せるのと、pythonよりも簡単にモデルの評価ができるので感動しました。チュートリアルではBigQueryのサンプルデータを用いていたのですが、この記事ではKaggleのtitanicデータを対象にモデル構築、評価、KaggleへSubmitまでやってみようと思います。 All BigQuery ML Documentation Getting Started with BigQuery ML for Data Analysts 前処理 https://www.kaggle.com/startupsci/titanic-data-science-solutions このカーネル（公開されて
sh19910711 2018/11/25
*data

gcloud

warehouse

*algorithm

機械学習
リンク
前のページ 1 2