matplotlibはPythonでグラフを描画するときなどに使われる標準的なライブラリです。 画像ファイルを作るばかりでなく、簡単なアニメーションやインタラクティブなグラフを作ることも可能です。 実際の例はmatplotlibサイトのギャラリーで見ることができます。 matplotlib/gallery matplotlibは本家のサイトやどこかのブログにあるチュートリアルや例を描画してみるぶんには簡単なのですが、 実際に自分でプロットするとなると基礎的な概念を理解していないと使いにくいライブラリでもあります。 また、基礎的な概念を理解していないとドキュメントを参照する際にもどこを見て、どう実用すればいいのかわかりません。 そこで、この記事ではそのあたりのmatplotlibの基礎を解説していきます。 なお、Python自体の知識はある程度仮定していますが、matplotlib自体の実装
scikit-learn(sklearn)の日本語の入門記事があんまりないなーと思って書きました。 どちらかっていうとよく使う機能の紹介的な感じです。 英語が読める方は公式のチュートリアルがおすすめです。 scikit-learnとは? scikit-learnはオープンソースの機械学習ライブラリで、分類や回帰、クラスタリングなどの機能が実装されています。 また様々な評価尺度やクロスバリデーション、パラメータのグリッドサーチなどの痒いところに手が届く機能もあります。 インストール scikit-learnの他にもnumpyとかscipyとかが必要です。 Windows 64 bit版の人は以下のURLに色々なインストーラーがおいてあるのでおすすめ Python Extension Packages for Windows - Christoph Gohlke その他の人は以下のURLを見て
この投稿で作成する環境は https://bitbucket.org/toruuetani/venv_base で構築できる。 hg clone して cmd.bat を実行すると、 Fabric がインストールされた virtualenv 環境が構築される。 前提 windows PC で開発し、それを動作させるのは別の windows PC 。ただし、その PC はオフライン環境で動作する。 なぜ今頃 pip を使いだすのか pip はバイナリからインストールできないから。 pure python でないパッケージはソースからコンパイルしないといけないが、 linux と違って windows には C コンパイラがないことが多いため、 そういうパッケージをインストールできない。そのため windows 向けにバイナリパッケージが用意されている(XXX-1.2.1.win32-py2.
はじめに 本記事は、Googleから発表されているAndroid Autoの特徴や機能に関してまとめた記事です。 Android Autoの現在使用可能な機能、将来的に使用出来る機能およびそのアプリケーションの構成に関して、大きく分けて以下のようにまとめています。(2015/03/13時点) Android Autoとは Android Autoの動作環境 Android Appについて 今後の展望について ※本記事を記載するにあたって、以下のURLを参考にしております。 Android Auto公式 Android Auto: The right information for the road ahead Android Auto Demo at Google I/O 2014 Google Developers Building Apps for Auto Devbytes Andr
もうApp Storeだけではない。今後はGoogle Playにもアプリの審査が必要になる! 本日からGoogleはGoogle Playにおいてスタッフによる審査システムと年齢別レーティングを導入することを発表した! ユーザーを守るためのアプリ審査システム これまでGoogle Playへのアプリ申請は審査が不要であることで有名だった。「App Storeは審査に時間が掛かるから、まずはGoogle Playから出そう」と言う事業判断もあり得る時代があったわけだ。 今後はどちらのアプリマーケットにおいても、世の中の人にダウンロードしてもらうためには事前審査の通過が条件となる。両プラットフォームでアプリを今後展開予定の人は要注意だ。 Googleは申請されたデベロッパーポリシーに従っているかを確認するチームを結成。スピード感を重要視していることから審査に数日間や数週間掛かるApp Sto
Posted by Eunice Kim, Product Manager for Google Play Whether it's a way to track workouts, chart the nighttime stars, or build a new reality and battle for world domination, Google Play gives developers a platform to create engaging apps and games and build successful businesses. Key to that mission is offering users a positive experience while searching for apps and games on Google Play. Today w
前回まで分布の把握、区間推定と進めてきました。ここから先は複数の変量に相関があるかを調べていくわけですが、手順の整理なので細かい話は各記事に譲るとして、大まかな説明をしてきます。 推測統計 統計の手法には多く分けて二つあります。記述統計と推測統計です。記述統計とは、データを大まかに要約し、図表などで可視化しようというものです。これは最も古くからある統計の利用方法です。記述統計による考え方というのには大きな制約があります。そもそも全データが明らかであることを前提に、そのすべてを詳細に見ることができないので要約して可視化しようというものだからです。 わたしたちが観察することのできるデータは全体のごく一部ということがほとんどですから、そこで推測統計の考え方が必要になります。そのために分布を把握し、ありそうな値の範囲を推定するということをしたわけです。これが推測統計と呼ばれるものです。以前にモンテ
昨日からデータ分析の基本的な手順を整理していますがその続きです。 分析のための道具を選定する 週末に開催された PyCon JP 2014 ではまだまだ Python 2 系の利用者が多いという話がありましたし Heroku の Kenneth Reitz は No Benefit なんて言っていましたが、実際のところ 2014 年現在において Python を使うなら 3.x 系だんぜん一択です。ちなみにその後の日本人の発表でも大体の人は Python 3 を推していたように思います。 Python 3 を使う理由 データ分析で Python 3 を使う理由を筆者の考えとして挙げます。 文字列型のエンコーディングが Unicode を既定としている Python 2 には新しい機能は追加されず、今後登場するライブラリも Python 3 ベースである もはやこの 2 つだけでも十分でしょ
D3.js のチュートリアルの日本語訳がここにあるわけですが、解説は丁寧なのですけど全体が 16 章もあって冗長なのでまとめます。 メソッドチェーン D3.js の基本的なスタイルはメソッドチェーンです。 var dataset = [5, 10, 15, 20, 25]; var get_data = function(d) { return d; }; var get_color = function(d) { if (d >= 15) { return "red"; } else { return "black"; }; }; d3.select("body").selectAll("p") .data(dataset) .enter() .append("p") .text(get_data) .style("color", get_color); var dataset = [
matplotlib と pandas によるさまざまな図の描画方法を以前に紹介しました。しかしその具体的なパラメーターについては触れませんでした。今回から数回に渡り matplotlib による図形描画について追っていこうと思います。 図とサブプロット matplotlib の Figure オブジェクトはプロット機能を提供します。 plt.figure() メソッドは何も描画されていない新しいウィンドウを描画します。 add_subplot() メソッドはその内部にサブプロットを生成します。 import numpy as np from pandas import * from pylab import * import matplotlib.pyplot as plt from matplotlib import font_manager from numpy.random imp
まずはじめに、データ可視化は真の目的ではありません。手段です。 Vitaly Friedman の有名な言葉で、データ可視化の大目的は明瞭かつ効果的に情報とコミュニケーションができるように、データを視覚化できる能力そのものである (The main goal of data visualization is its ability to visualize data, communicating infomation clearly and effectivelty.) というものがあります。 情報を視覚的に伝える 明確に情報を伝える 効果的に情報を伝える こういったことがデータ可視化の要件かと思います。 とくに、何のための可視化なのかという大目的を見失ってはいけません。 この辺の話は以下の「データ可視化勉強会」のスライドがとても素晴らしいのであわせて参照すると良いでしょう。 http:
本エントリは、次のAdvent Calendarのために書かれたものです。 Python Advent Calendar 2013 (12月24日) 取り扱う内容 Pythonのデータ分析用ライブラリであるPandasの紹介と簡単なサンプルコードを取り扱います。 Pandasとは 一時期盛り上がったけどあんまりPandasの情報出てこないからよーしエントリ書いちゃうぞー、と息巻いていたらこのようなフルスタックな書籍が出版されるようです。 [amazonjs asin="4873116554" locale="JP" title="Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理"] どう見てもこの書籍のほうが有益です。本当にありがとうございました。 ...まぁ、発売日より2日早いのでセーフ(なにが?)として、めげずに続けます。 Pandas pandas is
PyCon JP 2014 チュートリアル「PyData入門」のお知らせ | Librabuch 上記のエントリで告知した通り、2014年09年12日(金)に行われるチュートリアルの講師を務める御縁を頂いています。29枚あったチケットは完売のようで、若干プレッシャーの高まりを感じる今日この頃です。 さて、チュートリアル開催にあたり、利用するライブラリ群のインストール方法をOS毎に確認していたのでこちらにも備忘録として残しておきます。(参加者の方々には専用経路で別途ご案内差し上げます) 導入手順 共通 Windows版 Mac版 動作確認 導入したいもの 今回導入したいライブラリは下記の通りです。 NumPy Scipy Pandas scikit-learn matplotlib IPython 共通手順 Python3.4.1をインストールしてPATHを通しておきます。(手順問わず) p
みなさまこんばんは。Python Advent Calendar 2014 24日目の記事です。 先日のpyhackで@atelierhideに教えてもらった、データ前処理スト垂涎のライブラリの紹介をすることにしました。 csvkit とは csvkitは、コマンドラインでCSVやTSVファイルを取り扱うのに便利なライブラリです。データの前処理や加工をLinux/UNIXのコマンドラインで行っている環境もあると思いますが、それを代替する、あるいは組み合わせて使うとよいのがcsvkitです。 csvkit pipでインストール出来ます。Python3.4にもインストールは可能ですが、一部の機能が動作しないことを確認しています。今回は2.7にインストールしました。 pip install csvkit 具体的な使い方を見ていきます。 基本的な使い方 ここからはiris.csvのデータをcsvk
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く