6. 便利なシチュエーショ ン • 「 少し 寝たっ ぽいから 、 テレビつけてみよ」 ( し ばし し て) 「 あら 、 泣き はじ めた…!」 ( 抱っ こ ) ( テレビ消し たい…が、 手がふさ がっ ている…!) 「 オッ ケーグーグル、 テレビ消し て!」 Kei Shiratsuchi, レトリバセミナー
![20180609 chainer meetup_es_pnet](https://cdn-ak-scissors.b.st-hatena.com/image/square/9841cf496affda93cd37173236d0cf03e053b8c1/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2F20180609chainermeetupespnet-180609064829-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)
のようになっています。 click_time以外はカテゴリカルデータで、始めから整数で表現(Label Encoding)されたものが与えられています。 これはデータとしては非常にシンプルでここからいかに情報を引き出すかがポイントとなります。 アンバランスな目的変数 以上を用いて予測する対象がis_attributedというアプリダウンロード有無の指標です。 is_attributedが1のデータは広告クリック後にアプリがダウンロードされたクリックイベント、0のデータはそうでないものです。 約1.8億件の訓練データ全体に対してis_attributed=1のデータは50万件弱で、割合にして約0.2%と非常に少ないです。 このように、目的変数の分布がアンバランスであることがこのコンペの特徴のひとつです。 ちなみにアプリがダウンロードされた時刻attributed_timeも与えられていますが
Data Visualization Now let's see what sort of data you have. You want data with various patterns occurring over time. plt.figure(figsize = (18,9)) plt.plot(range(df.shape[0]),(df['Low']+df['High'])/2.0) plt.xticks(range(0,df.shape[0],500),df['Date'].loc[::500],rotation=45) plt.xlabel('Date',fontsize=18) plt.ylabel('Mid Price',fontsize=18) plt.show() This graph already says a lot of things. The spe
Your team might be on top of its code and containers, but your data feels far behind. Quilt to transforms scattered, unlabeled data into reproducible, discoverable, and trusted datasets. Discover pharmaceuticals, targets, and models faster. Quilt consists of a Python API, web catalog, and backend to manage your datasets in S3. Your team might be on top of its code and containers, but your data fee
This article is the first in a series of guest blog posts about open source projects in the Jupyter ecosystem and the problems they attempt to solve. If you would like to submit a guest post to highlight a specific tool or project, please get in touch with us. Jupyter Notebooks go a long way towards making computations reproducible and sharable. Nevertheless, for many Jupyter users, it remains a c
講師:寺田 学(代表理事) 担当:一般社団法人PyCon JP レベル:入門編 対象者:これからPythonで機械学習を学びたい人 前提知識:機械学習に興味がある方。 目標: OSS&Pythonで機械学習を行う概要を知る Pythonで機械学習する上で多く使用されている、Jupyter Notebookを用い、実際に動くものを見せていきます。 動くものとしては、チュートリアルを準備しgithub上で公開します。ポイントを押さえたテキストを発表資料にまとめました。 このチュートリアルは独自のデータを用いることにこだわりました。今回は、千葉市のオープンデータを用い、 気象庁が公開している気象データから、「インフルエンザの流行」を予測してみようという壮大なテーマに挑戦します。 このような例を提示することで、より身近なテーマを機械学習に取り入れられるのではないかと考えたからです。
Kubernetes 1.8ではα版(実験的)機能としてPodからGPUを使うことが可能になっています。 KubernetesからGPUを使うメリットは、ディープラーニングとコンテナ・オーケストレーションを組み合わせられることです。 ディープラーニングのトレーニングフェーズではGPUを使うことでスピードアップするのが一般的です。 NvidiaもDockerからGPUとCUDAを使うためのNvidia Dockerを提供しており、コンテナ上でGPUを使うのは有効な手段として広まっていっていると感じます。 KubernetesでもGPU使用が要望されており、現在はα版として使用可能になっています。 KubernetesからGPUを使う方法 詳しくは以下で書かれていますが、ホストサーバにインストールしたNvidia CUDAやCudnnのライブラリをPodにマウントして呼び出す仕組みになっていま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く