
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【Pandas】データベーステーブル読込み時のメモリエラーを回避する - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【Pandas】データベーステーブル読込み時のメモリエラーを回避する - Qiita
※"データベース" とはPostgreSQL(またはAmazon RedShift)を指しています。 TLDR pyscopg2のサーバーサ... ※"データベース" とはPostgreSQL(またはAmazon RedShift)を指しています。 TLDR pyscopg2のサーバーサイドカーソルを併用してデータを読み込んでいく必要がある。 (※PostgreSQL限定) サーバーサイドカーソル、クライアントサイドカーソルについては下記記事が大変参考になる。 PythonとDB: DBIのcursorを理解する 事象 pandasでは、一度にメモリに乗り切らない巨大なデータを一定量ごとに読み込んで逐次処理するためのchunksizeオプションが用意されている。 しかし、巨大なDBテーブルの読み込みにchunksizeを指定してもメモリエラーが発生するケースがあった。 >>> import pandas as pd >>> engine = get_engine() # 10,000行テーブルの読込み(成功) >>> small_df