AWS Batchで速く/安くやるデータセットの前処理 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/derui@github

34users がブックマークコメント

コメント

3

記事へのコメント3件

注目コメント
新着コメント

aipacommander いつか使いそうなのでブクマ

2018/08/15 リンク

syou6162 AWS Batch、結構便利なのよね

aws

2018/08/14 リンク

yukiyan_w NLPの前処理で使おうと思ってたので、ありがたい情報

2018/08/14 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

AWS Batchで速く/安くやるデータセットの前処理 - Qiita

OpenStreamアドベントカレンダーの一日目です。結構前からやっている趣味 DeepLearningですが、最近（実... OpenStreamアドベントカレンダーの一日目です。結構前からやっている趣味 DeepLearningですが、最近（実際は結構前から）次のような問題に当たり始めました。データセットが大きくなってきてHDDが厳しいデータセットが大きくなってきて前処理がやばい小さいデータセット＋Augmentationでなんとかなるものはいいんですが、現在最大のデータセットは画像33万枚、220GB弱あります。んで、これを前処理したり何だりしていると、最終的に学習で利用するデータを作成するだけで、HDDが500GBくらい利用されてしまう状態です。容量も当然厳しいんですが、一番厳しいのは処理時間です。現状の前処理を行うと、大体 12時間くらいかかります。趣味でやるので基本的に自分のPCでやっていると、HDDが悲鳴を上げる上に、実行している間はレイテンシが悪すぎて他の作業もできないって状態になっ

ブックマークしたユーザー

stack_stuck2018/08/20
aipacommander2018/08/15
kiichi692512018/08/14
nyuji2018/08/14
masa-wo2018/08/14
mstk-o2018/08/14
tuki09182018/08/14
kuyo2018/08/14
M-Statistics2018/08/14
yamakozawa2018/08/14
s12512018/08/14
Makots2018/08/14
atomicmap2018/08/14
rohki2018/08/14
tomiyanx2018/08/14
akitera2018/08/14
sesejun2018/08/14
syou61622018/08/14

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx