shinyorkeのブックマーク / 2019年5月10日

pandasデータフレームのforループ処理高速化ーPythonのmultiprocessingによる並列処理 - こここブログ

2019-05-10-公開, 2019-09-26-公開前提 <2019-09-26追記> forループはできるだけ避けること。groupbyを使って同様の実装を行うだけで想像以上に高速になる。 pandasのgroupbyを使えば、2つ以上のDataFrameを結合した後の行数のカウントや集計も可能処理速度は圧倒的に速く、並列化も不要になる forを使わない方法を頭と時間をかけて考えてもお釣りがくるどうしても思いつかない場合の救済手段として、以下の内容を参考にforループでの実装と高速化を行うやりたいこと forループで書いている処理を高速化したい Pythonのpandasデータフレームの各行について、他のデータフレームを集約しつつ値を変更する処理こんなの ↓ を高速化したい for i in range(df_user.shape[0]): # df_userの対象行のus

はてなブックマーク

タグ

2019年5月10日のブックマーク (1件)

pandasデータフレームのforループ処理高速化ーPythonのmultiprocessingによる並列処理 - こここブログ

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス