【Pythonお悩み解決】データセットがメモリにのらないときの対処法Beginaid

テクノロジーカテゴリーの変更を依頼記事元:

tips-memo.com

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

【Pythonお悩み解決】データセットがメモリにのらないときの対処法Beginaid

対処法少しトリッキーですが，datasetに渡すのは「予めバッチサイズに分割されたデータが格納されたpat... 対処法少しトリッキーですが，datasetに渡すのは「予めバッチサイズに分割されたデータが格納されたpath名のリスト」とします。こちらの記事（【超初心者向け】ド素人がPyTorchで自作データセットを作るまで。）でも説明しているように，普通pytorchデフォルトのdatasetを使っている場合はdatasetクラスのインスタンスを生成するために全データそのものを渡します。しかし，使用するデータが莫大な場合には，データセットを一旦全部読み込んでしまうため，メモリが大量消費されます。この現象を回避するためには，毎回のイテレーションごとにデータセットを読み込む必要があります。そこで，pytorchにdatasetとして認識させるのは，データセットのpath名が格納されたリストだということにします。そうすれば，pytorchのdatasetとdataloaderが「どのバッチを選ぶのか」と

ブックマークしたユーザー

showgotch2023/06/05

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx