タグ

2018年3月8日のブックマーク (6件)

  • Python と R の違い・関数の対応表

    このページをご覧になる皆さんの中には、統計分析ソフトウェアの R を使った分析には慣れていても、Python を使いこなせていない方は多いのではないでしょうか。 以下の Ajay Ohri 氏のスライド、”Python for R Users” では、R と Python の操作方法の違いを分かりやすくまとめられています。ページでは、以下スライドの内容を日語で紹介したいと思います。この内容を理解しておけば、R 経験者にとっては短時間で Pythonデータ分析機能を習得できるでしょう。 Python for R Users from Ajay Ohri 基的なコマンド (パッケージの追加、ディレクトリ操作など) R Python

  • Python: KMeans 法を実装してみる - CUBE SUGAR CONTAINER

    KMeans 法は、機械学習における教師なし学習のクラスタリングという問題を解くためのアルゴリズム。 教師なし学習というのは、事前に教師データというヒントが与えられないことを指している。 その上で、クラスタリングというのは未知のデータに対していくつかのまとまりを作る問題をいう。 今回取り扱う KMeans 法は、比較的単純なアルゴリズムにも関わらず広く使われているものらしい。 実際に書いてみても、基的な実装であればたしかにとてもシンプルだった。 ただし、データの初期化をするところで一点考慮すべき内容があることにも気づいたので、それについても書く。 KMeans 法の具体的なアルゴリズムについてはサンプルコードと共に後述する。 今回使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.3 BuildVersion

    Python: KMeans 法を実装してみる - CUBE SUGAR CONTAINER
    showyou
    showyou 2018/03/08
    あとで試す
  • Python: データセットの標準化について - CUBE SUGAR CONTAINER

    今回は機械学習とか統計で扱うデータセットの標準化について。 まずは、標準化されていない生のデータセットについて考えてみよう。 それらの多くは、次元によって数値の単位がバラバラだったり、あるいは大きさが極端に異なったりする。 これをそのまま扱ってしまうと、各次元を見比べたときにそれぞれの関係が分かりにくい。 また、機械学習においては特定の次元の影響が強く (または反対に弱く) 出てしまったりすることもあるらしい。 そこで、それぞれの次元のスケールを同じに揃えてやりたい。 これを標準化というようだ。 今回は「Zスコア」という標準化のやり方を扱う。 これは、一言で言ってしまえばデータセットの各要素から平均を引いて、標準偏差で割ったもの。 これをすると、データセットは平均が 0 で標準偏差・分散が 1 になる。 使った環境は次の通り。 $ python --version Python 3.5.1

    Python: データセットの標準化について - CUBE SUGAR CONTAINER
  • アクセスキーのコミットを抑止できて安全便利な awslabs/git-secrets - kakakakakku blog

    GitHubawslabs のリポジトリを眺めてたら git-secrets という便利なツール(シェルで実装されてる)を発見した. どんなものかを簡単に説明すると,アクセスキーなどを誤ってコミットすることを Git の hooks を使って未然に防ぐツールで,誤って GitHub に push してしまったために,AWS を不正利用されてしまった,みたいな事故もたまに聞くし,そういうのを防ぐことができる.非常に良かったので,一部のリポジトリに git-secrets を設定した. github.com インストール make install でも良いけど,Mac なら brew が使える. $ brew install git-secrets インストールすると git secrets コマンドが使えるようになった. $ git secrets usage: git secrets

    アクセスキーのコミットを抑止できて安全便利な awslabs/git-secrets - kakakakakku blog
    showyou
    showyou 2018/03/08
  • 統計検定 1 級に合格する方法 - Qiita

    はじめに: 統計学の重要性 NTT データ数理システムでリサーチャーをしている大槻 (通称、けんちょん) です。 今回は統計検定 1 級について記します。 統計検定とは日統計学会による公認の資格であり、統計に関する知識や活用力を評価するものです。 日常的に大量のデータが溢れている昨今、データ分析機械学習に対するニーズは最高の高まりを見せています。最近では何も考えずともただデータを入力するだけでデータ分析機械学習手法を実行してくれるツールも多数出回るようになりました。 データ分析機械学習を実際に遂行するにあたって、統計学は強力な基礎になります。確かに最近は便利なツールの発達のおかげで、統計を学ばずともデータ分析を実行できる環境が整いつつありますが、その状態でデータ分析手法や機械学習手法を実際に適用しようとすると、しばしば誤った推論をしてしまったり、複雑な状況に対してどのようなアプロー

    統計検定 1 級に合格する方法 - Qiita
  • 脳はベイジアンなのに、なぜ正しく確率の計算ができないのか? - Qiita

    脳がベイジアンだと思われる件 私たちは、不確実な世界に生きています。ゴミをゴミ箱に投げてもなかなか入りません(私は)。これは、私の脳が、私とゴミ箱の物理的な距離と、ゴミの重さといった物理量、また私自身の運動機能といった、サクセスフルにゴミを投げ入れるために必要な計算事柄を、正しく計算できていないことを表しています。 認知科学 (Cognitive Science)の世界では、ベイズ統計学 (Bayesian Statistics)を用いて、人や動物の認知・行動をモデリングする試みがなされてきました。ベイズの利点はもちろん、行動の達成に必要な計算事項に関する不確実性 (Uncertainty)を、確率を用いて定量できることです。人や動物は、不確実な世界から情報を取得し、記憶や経験と組み合わせて行動を実行します。そのためベイズ統計学を使って主観的な不確実性を定量することは、行動の理解に大きく貢

    脳はベイジアンなのに、なぜ正しく確率の計算ができないのか? - Qiita
    showyou
    showyou 2018/03/08
    あとで試す