タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

pythonとcolumn-oriented-dbmsとdata-processingに関するnabinnoのブックマーク (2)

  • (翻訳)毎秒10GBでArrowからpandasへ - Qiita

    始めに:pandasの作者であるWes McKinneyさんがPythonのデータツール関連でとても興味深いblogを書かれているので、翻訳して日のPyDataコミュニティに公開してもいいでしょうか、とお聞きしたところ、快諾をいただきましたので少しずつ訳して公開していこうと思っています。 毎秒10GBでArrowからpandasへ (原文:http://wesmckinney.com/blog/high-perf-arrow-to-pandas/ ) 2016/12/27 このポストでは、汎用的なArrowの列指向のメモリを、pandasのオブジェクトに高速に変換できるようにするための最近のApache Arrowでの作業について述べます。 pandasのDataFrameオブジェクトを高速に構築する際の課題 pandasのDataFrameオブジェクトを高速に構築する際に困難なことの1

    (翻訳)毎秒10GBでArrowからpandasへ - Qiita
  • pandas - Wikipedia

    pandasは、プログラミング言語Pythonにおいて、データ解析を支援する機能を提供するライブラリである。特に、数表および時系列データを操作するためのデータ構造と演算を提供する[2]。PandasはBSDライセンスのもとで提供されている[3]。 データ操作のための高速で効率的なデータフレーム (DataFrame) オブジェクト メモリ内のデータ構造とその他のフォーマットのデータ間で相互に読み書きするためのツール群。フォーマット例: CSV、テキストファイル、ExcelSQLデータベース、HDF5フォーマットなど データの調整および統合された欠損値処理 データセットの柔軟な変形およびピボット ラベルに基づいたスライス、fancyインデクシング、巨大なデータセットのサブセット取得 データセットに対するsplit-apply-combine操作を可能にするエンジンが提供するpowerful

    pandas - Wikipedia
  • 1