はじめに pythonのpandasにおけるメモリ節約の手法をいくつか紹介します。 一番言いたいことは「NaNを追加するとデータ型が自動的にfloat64に変更されてメモリが一気に倍増とかあるから気を付けて」ということです。その前準備としてデータ型の話から入ります。 列のデータ型に留意する NaNの発生に注意 (おまけ1)使わないデータは読み込まない (おまけ2)使わなくなったらメモリを解放する 列のデータ型に留意する 例えばint32は4バイト、int64は8バイトのメモリを確保します。レコード数、列数が増えれば大きな違いとなってコンピュータのメモリ容量を圧迫します。値の範囲がわかっていれば、できるだけバイト数の小さいデータ型を選択することをお勧めします。 実際にpandasのデータフレームを作成してメモリ使用量を見ていきます。その前準備として、データが入った2次元リストを作成します。
はじめに Pandasで巨大なデータを扱うと、貧弱なPCではすぐメモリエラーになるのではないでしょうか。 これまで結構苦労したので、Pandasでメモリ消費を抑えるコツを挙げておきます。 DataFrameについて書きますが、Seriesも同様です。Panelは触ったことないですが、きっと同様でしょう。多分。 使用した環境 Python 3.6 Pandas 0.20.3 メモリが必要以上に増大してしまうケース いろんな場合がありますが、以下のケースは、よくあるかつコードで対処可能なものだと思います。 【ケース1】 DataFrame構築時にカラムの型(dtype)を指定していない 【ケース2】 カラムを追加する・カラム全体へ値を代入する 【ケース3】 DataFrameに対する処理の戻り値を、他の変数で受け取る 詳しく見ていきます。 【ケース1】 DataFrame構築時にカラムの型(d
name Ysé さん illustrator & tattoo artist オーバーシルエットのジャケットがキーアイテム。着こなしを彩るカラーセーターに、ブラックで統一した小物使い、裾に覗かせた白Tシャツなど、細部にテクニックが光る。フィンガーレスの手袋で、防寒対策もお洒落に! ジャケット/The frankie shop、トップス、ネックレス/ともにWeekday、デニムパンツ/L e v I’s [Vintage]、ブーツ/Dr.Martens、バッグ/& Other Stories Photograph: Shimmura Mari FUDGE vol.222 2022年01月号より
ユーザーと物理的に近い位置(エッジ)にコンピューターを分散配置して処理を行う「エッジコンピューティング」が注目されるようになって久しい。しかし、エッジコンピューティングの恩恵を受けられる企業は限られている。多くのコンピューターから成る大規模なネットワークが必要になるためだ。 そうした企業には、自前のクラウドを持つ米Google(グーグル)や米Amazon.com(アマゾン・ドット・コム)などのいわゆる「GAFA」がある。例えばGoogleは、エッジでインターネットのクローリングを効率化していると考えられる。GAFA以外にも、動画配信サービスの米Netflix(ネットフリックス)が独自のCDN(コンテンツ・デリバリー・ネットワーク)を持ち、エッジでCDNをカスタマイズしているという。 企業などにCDNサービスを提供するCDN事業者も、世界規模のコンピューターネットワークを持つ。そこで各CDN
救済されない旧「2ちゃんねる」の中傷被害者とひろゆき氏の賠償金不払い Qアノンと日本発の匿名掲示板カルチャー【7】 清義明 ルポライター ひろゆき氏を参院選の「応援弁士」にした乙武氏 2022年6月、夏の参議院選挙に立候補を表明した乙武洋匡の選挙活動のキックオフイベントが都内で行われた。 ボランティアと支持者は若者ばかりで、イベント会場も選挙活動には似つかわしくない目黒のオシャレなイベント会場が選ばれていた。そして、その若者たちに囲まれる乙武氏の隣にはあの顔があった。 匿名掲示板『2ちゃんねる』の元管理人であり、実業家の肩書でもある西村博之氏である。最近ではユーチューバーといったほうがいいかもしれない。 乙武氏と西村氏は、この前日には渋谷駅前での街頭演説も行っており、二人の軽妙洒脱なやり取りもあり、ネットやメディアの一部では話題を呼んだ。例の飄々としながら毒舌も混じる西村氏とのイベントでの
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く