データサイエンス100本ノック(構造化データ加工編)のPythonの問題を解いていきます。この問題群は、模範解答ではpandasを使ってデータ加工を行っていますが、私達は勉強がてらにNumPyの構造化配列を用いて処理していきます。 次回記事(#2) はじめに Pythonでデータサイエンス的なことをする人の多くはpandas大好き人間かもしれませんが、実はpandasを使わなくても、NumPyで同じことができます。そしてNumPyの方がたいてい高速です。 pandas大好き人間だった僕もNumPyの操作には依然として慣れていないので、今回この『データサイエンス100本ノック』をNumPyで操作することでpandasからの卒業を試みて行きたいと思います。 今回は8問目までをやっていきます。 今回使うのはreceipt.csvだけみたいです。初期データは以下のようにして読み込みました(データ型
![だから僕はpandasを辞めた【データサイエンス100本ノック(構造化データ加工編)篇 #1】 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/7ec0215bdd89c32810fb0994a6b715bae2749640/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZ0eHQ9JUUzJTgxJUEwJUUzJTgxJThCJUUzJTgyJTg5JUU1JTgzJTk1JUUzJTgxJUFGcGFuZGFzJUUzJTgyJTkyJUU4JUJFJTlFJUUzJTgyJTgxJUUzJTgxJTlGJUUzJTgwJTkwJUUzJTgzJTg3JUUzJTgzJUJDJUUzJTgyJUJGJUUzJTgyJUI1JUUzJTgyJUE0JUUzJTgyJUE4JUUzJTgzJUIzJUUzJTgyJUI5MTAwJUU2JTlDJUFDJUUzJTgzJThFJUUzJTgzJTgzJUUzJTgyJUFGJUVGJUJDJTg4JUU2JUE3JThCJUU5JTgwJUEwJUU1JThDJTk2JUUzJTgzJTg3JUUzJTgzJUJDJUUzJTgyJUJGJUU1JThBJUEwJUU1JUI3JUE1JUU3JUI3JUE4JUVGJUJDJTg5JUU3JUFGJTg3JTIwJTIzMSVFMyU4MCU5MSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnR4dC1jbGlwPWVsbGlwc2lzJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9M2RkZmViYTM2NTQwZmJiOTU3ZDFmZWU5MjY0MmI0M2Y%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwbmtheSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9OTFjZGNjNjMyZDY2NmY4Yzc1YmYwMTZlMjNlZTkzYWE%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3Dc2c5a765cd03c87b25f9399cb538d8f1)