タグ

2017年9月14日のブックマーク (4件)

  • PythonでPandasのPlot機能を使えばデータ加工からグラフ作成までマジでシームレス - Qiita

    Pandasのグラフ描画機能 この記事ではPandasのPlot機能について扱います。 Pandasはデータの加工・集計のためのツールとしてその有用性が広く知られていますが、同時に優れた可視化機能を備えているということは、意外にあまり知られていません。 この機能は Pandas.DataFrame.plot() もしくは Pandas Plot と呼ばれるものです。 Pandas Plotを使いこなすことが出来るようになれば、 データの読み込み、保持 データの加工 データの集計 データの可視化 というデータ分析の一連のプロセスを全てPandasで完結させることが出来る、つまり分析の「揺りかごから墓場まで」を実現することが出来ます。 Pandasのプロット以外の機能について この記事ではPandasのデータハンドリングなどに関わる機能は説明しません。 そちらにも興味がある方は下記の記事などを

    PythonでPandasのPlot機能を使えばデータ加工からグラフ作成までマジでシームレス - Qiita
    kdmgs110
    kdmgs110 2017/09/14
    pythonでpandasを利用してmatplotlibを利用する
  • Pyplot tutorial — Matplotlib 2.0.2 documentation

    Pyplot tutorial¶ matplotlib.pyplot is a collection of command style functions that make matplotlib work like MATLAB. Each pyplot function makes some change to a figure: e.g., creates a figure, creates a plotting area in a figure, plots some lines in a plotting area, decorates the plot with labels, etc. In matplotlib.pyplot various states are preserved across function calls, so that it keeps track

    kdmgs110
    kdmgs110 2017/09/14
    matplotlibのtutorial 後で読もう
  • matplotlib (+ pandas) によるデータ可視化の方法 (3) - Qiita

    前々回、前回に引き続いて matplotlib によるデータ可視化に焦点を当てていきます。今回から pandas との組み合わせによる合わせ技となります。 折れ線グラフ シリーズやデータフレームのオブジェクトをプロットすると、デフォルトでは折れ線グラフとなります。 import numpy as np from pandas import * from pylab import * import matplotlib.pyplot as plt from numpy.random import randn # シリーズの単純なプロッティング s = Series(np.random.randn(10).cumsum(), index=np.arange(0, 100, 10)) s.plot() plt.show() plt.savefig("image.png") # データフレームの単

    matplotlib (+ pandas) によるデータ可視化の方法 (3) - Qiita
    kdmgs110
    kdmgs110 2017/09/14
    このへんpandasとmatplotlibでよさそう!
  • pandasにsqlでよくやる処理をやらせてみる | mwSoft

    概要 pythonによるデータ分析入門を参考に、MovieLens 1Mを使ってsqlで普段やってるようなこと(joinとかgroup byとかsortとか)をpandasにやらせてみる。 ファイルの読み込み 落としてきたファイルを解凍すると、movies.dat、rating.dat、users.datという3つのファイルが入っているので、read_csvで読み込む。 import pandas as pd movies = pd.read_csv( 'ml-1m/movies.dat', sep='::', header=None, names=['movie_id', 'title', 'genres'] ) ratings = pd.read_csv( 'ml-1m/ratings.dat', sep='::', header=None, names=['user_id', 'mo

    kdmgs110
    kdmgs110 2017/09/14
    これはわかりやすい。pandasで取得したデータを操作する。join系も取り扱う