始めに:pandasの作者であるWes McKinneyさんがPythonのデータツール関連でとても興味深いblogを書かれているので、翻訳して日本のPyDataコミュニティに公開してもいいでしょうか、とお聞きしたところ、快諾をいただきましたので少しずつ訳して公開していこうと思っています。 毎秒10GBでArrowからpandasへ (原文:http://wesmckinney.com/blog/high-perf-arrow-to-pandas/ ) 2016/12/27 このポストでは、汎用的なArrowの列指向のメモリを、pandasのオブジェクトに高速に変換できるようにするための最近のApache Arrowでの作業について述べます。 pandasのDataFrameオブジェクトを高速に構築する際の課題 pandasのDataFrameオブジェクトを高速に構築する際に困難なことの1
背景 トレーディングカードゲームの元祖「Magic: The Gathering(MTG)」のカード情報の一覧が、MTG JSONという名で、JSON形式のファイルで公開されています。 Udemyの実践 Python データサイエンスを中盤ぐらいまで進めたものの、まだPandasが身体に馴染んでないなと感じていたため、このMTG JSONで手に覚えさせようと考えました。 なお、Pandasを使ってのMTG JSONのデータ分析は、すでにKaggleで素晴らしい投稿がいくつもあります。今回はこれらの投稿を参考にさせてもらいながら、少しずつMTG JSONの中身を探って行きたいと思います。 ※以降、MTG用語については特に説明なく登場します。逐次説明は厳しいと思ったため…… MTG JSONのダウンロード 公式ページにアクセスして「All Sets」をダウンロードします。こちらには各セットのカ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く