タグ

2017年11月18日のブックマーク (5件)

  • リスト、NumPy、Pandas間の変換 - ぺーぺーSEのブログ

    リスト(Python標準)、ndarray(NumPy)、Series(Pandas)、DataFrame(Pandas)間での変換についてまとめる。 はじめに、前提として下記のインポート、データ定義等があるとする。 import numpy as np import pandas as pd _1dlist = [1, 2, 3] _2dlist = [[1, 2, 3], [4, 5, 6]] # NumPy _1darray = np.array([4, 5, 6]) _2darray = np.array([[1, 2, 3], [4, 5, 6]]) _3darray = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]], [[9, 10], [11, 12]], [[13, 14],[15, 16]]]) # Pandas _series

    リスト、NumPy、Pandas間の変換 - ぺーぺーSEのブログ
  • Python pandas データ選択処理をちょっと詳しく <前編> - StatsFragments

    概要 書いていて長くなったため、まず前編として pandas で データを行 / 列から選択する方法を少し詳しく書く。特に、個人的にはけっこう重要だと思っている loc と iloc について 日語で整理したものがなさそうなので。 サンプルデータの準備 import pandas as pd s = pd.Series([1, 2, 3], index = ['I1', 'I2', 'I3']) df = pd.DataFrame({'C1': [11, 21, 31], 'C2': [12, 22, 32], 'C3': [13, 23, 33]}, index = ['I1', 'I2', 'I3']) s # I1 1 # I2 2 # I3 3 # dtype: int64 df # C1 C2 C3 # I1 11 12 13 # I2 21 22 23 # I3 31 32

    Python pandas データ選択処理をちょっと詳しく <前編> - StatsFragments
    Kanasansoft
    Kanasansoft 2017/11/18
    loc/iloc/ixの使い方。引数の書き方で戻り値が違う。『手元で対話的にちょっと試す場合は ix が便利』『ある程度の期間使うようなスクリプトを書く場合は 少し面倒でも iloc, loc が安全』
  • Jupyter事始め - Qiita

    はじめに Jupyter初心者なので、AWS EC2上の環境構築方法、簡単な使い方を半年後の自分用にチラシの裏しておきます。 細かい設定はさておき、手っ取り早くEC2上にJupyter環境を構築し、Jupyter上で簡単なPython scriptを動かして、JupyterのUI操作方法の初歩を覚える所までを目標とします。Linux戦闘力が低いので、極力コピペで手順がなぞれる様に心がけます。 なお、Amazon EMRを使ってSpark Cluster上にJupyterを作りたい場合にはこちらを参照下さい。また、Jupyter Notebookは次期VersionよりJuypter Labとなり大きくUI/機能が変わる予定です。Jupyter Labの環境構築方法はこちらを参照下さい。 Jupyter環境構築 まずは、Jupyter環境を構築する手順です。 EC2の作成 Jupyterを動

    Jupyter事始め - Qiita
    Kanasansoft
    Kanasansoft 2017/11/18
    Jupyter Notebookをサーバで起動する方法。ヒストグラム・3Dグラフ、LaTeXを表示する方法等。
  • Jupyter Notebook の Tips をまとめてみた | AI tech studio

    こんにちは、AI Lab の馬場です。 このブログは CyberAgent Developers Advent Calendar 2016 の11日目の記事です。 昨日は sitotkfm さんの「ログを集める時に気をつけたいポイント」という記事でした。 この記事では、僕が仕事データ分析をやっていく上で大変お世話になっている Jupyter Notebook の Tips をまとめてみます。Jupyter Notebook では便利な機能がたくさんあるので、ちゃんと使うと無駄作業の削減になります。僕もこれまで分析途中で「あーこれができたらなあ」と検索しては時間をつぶしてきたので、ここでまとめて記憶にとどめておきたいと思います。 図表・可視化系 notebook 内に図を表示したい 単純に jupyter notebook を起動して、pyplot などでグラフを描画しようとしても、図は

    Jupyter Notebook の Tips をまとめてみた | AI tech studio
    Kanasansoft
    Kanasansoft 2017/11/18
    図表・可視化/最終行の値のように成型された出力を途中行でも行う方法(display)/実行時間測定/環境変数出力/Shell実行/有効になっている変数の出力/画像の高出力化/お勧め機能拡張
  • UCI Machine Learning Repository

    Welcome to the UC Irvine Machine Learning Repository We currently maintain 665 datasets as a service to the machine learning community. Here, you can donate and find datasets used by millions of people all around the world!

    Kanasansoft
    Kanasansoft 2017/11/18
    カリフォルニア大学アーバイン校が公開している機械学習用データセットのリポジトリ。