タグ

2017年4月23日のブックマーク (3件)

  • Python pandas データ選択処理をちょっと詳しく <前編> - StatsFragments

    概要 書いていて長くなったため、まず前編として pandas で データを行 / 列から選択する方法を少し詳しく書く。特に、個人的にはけっこう重要だと思っている loc と iloc について 日語で整理したものがなさそうなので。 サンプルデータの準備 import pandas as pd s = pd.Series([1, 2, 3], index = ['I1', 'I2', 'I3']) df = pd.DataFrame({'C1': [11, 21, 31], 'C2': [12, 22, 32], 'C3': [13, 23, 33]}, index = ['I1', 'I2', 'I3']) s # I1 1 # I2 2 # I3 3 # dtype: int64 df # C1 C2 C3 # I1 11 12 13 # I2 21 22 23 # I3 31 32

    Python pandas データ選択処理をちょっと詳しく <前編> - StatsFragments
  • カーネル密度推定 - Wikipedia

    正規分布の100個の乱数と異なる平滑化帯域幅によるカーネル密度推定。 カーネル密度推定(カーネルみつどすいてい、英: kernel density estimation)は、統計学において、確率変数の確率密度関数を推定するノンパラメトリック手法のひとつ。エマニュエル・パルツェン(英語版)の名をとってパルツェン窓(英: Parzen window)とも。大まかに言えば、ある母集団の標のデータが与えられたとき、カーネル密度推定を使えばその母集団のデータを外挿できる。 ヒストグラムは、一様なカーネル関数によるカーネル密度推定量と見ることもできる。

    カーネル密度推定 - Wikipedia
  • コンソールへの出力を上書きしてゆく方法 - Qiita

    とするとコンソール上に 1 2 3 4 5 … と、縦長に出力されてしまう。 これだと見づらいので、インストールの時に表示される進度メーターのように、次の数字を出力する際に前の出力が消えて そこに次の数字が現れてほしい。 上書きする場合 import sys, time for num, i in enumerate(range(100)): sys.stdout.write("\r%d" % num) sys.stdout.flush() time.sleep(0.01)

    コンソールへの出力を上書きしてゆく方法 - Qiita