[B! python][column-oriented-dbms][data-processing] nabinnoのブックマーク

nabinno id:nabinno

pythonとcolumn-oriented-dbmsとdata-processingに関するnabinnoのブックマーク (2)

（翻訳）毎秒10GBでArrowからpandasへ - Qiita
始めに：pandasの作者であるWes McKinneyさんがPythonのデータツール関連でとても興味深いblogを書かれているので、翻訳して日本のPyDataコミュニティに公開してもいいでしょうか、とお聞きしたところ、快諾をいただきましたので少しずつ訳して公開していこうと思っています。毎秒10GBでArrowからpandasへ（原文：http://wesmckinney.com/blog/high-perf-arrow-to-pandas/ ） 2016/12/27 このポストでは、汎用的なArrowの列指向のメモリを、pandasのオブジェクトに高速に変換できるようにするための最近のApache Arrowでの作業について述べます。 pandasのDataFrameオブジェクトを高速に構築する際の課題 pandasのDataFrameオブジェクトを高速に構築する際に困難なことの1
nabinno 2017/05/21
qiita

pandas

python

data-processing

analytics

apache-arrow

column-oriented-dbms
リンク
pandas - Wikipedia
pandasは、プログラミング言語Pythonにおいて、データ解析を支援する機能を提供するライブラリである。特に、数表および時系列データを操作するためのデータ構造と演算を提供する[2]。PandasはBSDライセンスのもとで提供されている[3]。データ操作のための高速で効率的なデータフレーム (DataFrame) オブジェクトメモリ内のデータ構造とその他のフォーマットのデータ間で相互に読み書きするためのツール群。フォーマット例: CSV、テキストファイル、Excel、SQLデータベース、HDF5フォーマットなどデータの調整および統合された欠損値処理データセットの柔軟な変形およびピボットラベルに基づいたスライス、fancyインデクシング、巨大なデータセットのサブセット取得データセットに対するsplit-apply-combine操作を可能にするエンジンが提供するpowerful
nabinno 2017/05/20
pandas

web-mckinney

python

data-processing

column-oriented-dbms

database
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx