Arahabicaのブックマーク / 2017年4月23日

Arahabica id:Arahabica

2017年4月23日のブックマーク (3件)

Python pandas データ選択処理をちょっと詳しく <前編> - StatsFragments
概要書いていて長くなったため、まず前編として pandas でデータを行 / 列から選択する方法を少し詳しく書く。特に、個人的にはけっこう重要だと思っている loc と iloc について日本語で整理したものがなさそうなので。サンプルデータの準備 import pandas as pd s = pd.Series([1, 2, 3], index = ['I1', 'I2', 'I3']) df = pd.DataFrame({'C1': [11, 21, 31], 'C2': [12, 22, 32], 'C3': [13, 23, 33]}, index = ['I1', 'I2', 'I3']) s # I1 1 # I2 2 # I3 3 # dtype: int64 df # C1 C2 C3 # I1 11 12 13 # I2 21 22 23 # I3 31 32
Arahabica 2017/04/23
python
リンク
カーネル密度推定 - Wikipedia
正規分布の100個の乱数と異なる平滑化帯域幅によるカーネル密度推定。カーネル密度推定（カーネルみつどすいてい、英: kernel density estimation）は、統計学において、確率変数の確率密度関数を推定するノンパラメトリック手法のひとつ。エマニュエル・パルツェン（英語版）の名をとってパルツェン窓（英: Parzen window）とも。大まかに言えば、ある母集団の標本のデータが与えられたとき、カーネル密度推定を使えばその母集団のデータを外挿できる。ヒストグラムは、一様なカーネル関数によるカーネル密度推定量と見ることもできる。
Arahabica 2017/04/23
統計
リンク
コンソールへの出力を上書きしてゆく方法 - Qiita
とするとコンソール上に 1 2 3 4 5 … と、縦長に出力されてしまう。これだと見づらいので、インストールの時に表示される進度メーターのように、次の数字を出力する際に前の出力が消えてそこに次の数字が現れてほしい。上書きする場合 import sys, time for num, i in enumerate(range(100)): sys.stdout.write("\r%d" % num) sys.stdout.flush() time.sleep(0.01)
Arahabica 2017/04/23
python
リンク
- 2017年4月24日
- 2017年4月23日
- 2017年4月21日