showyouのブックマーク / 2018年3月8日

Python と R の違い・関数の対応表

このページをご覧になる皆さんの中には、統計分析ソフトウェアの R を使った分析には慣れていても、Python を使いこなせていない方は多いのではないでしょうか。以下の Ajay Ohri 氏のスライド、”Python for R Users” では、R と Python の操作方法の違いを分かりやすくまとめられています。本ページでは、以下スライドの内容を日本語で紹介したいと思います。この内容を理解しておけば、R 経験者にとっては短時間で Python のデータ分析機能を習得できるでしょう。 Python for R Users from Ajay Ohri 基本的なコマンド (パッケージの追加、ディレクトリ操作など) R Python

showyou 2018/03/08

*Python
R

リンク

Python: KMeans 法を実装してみる - CUBE SUGAR CONTAINER

KMeans 法は、機械学習における教師なし学習のクラスタリングという問題を解くためのアルゴリズム。教師なし学習というのは、事前に教師データというヒントが与えられないことを指している。その上で、クラスタリングというのは未知のデータに対していくつかのまとまりを作る問題をいう。今回取り扱う KMeans 法は、比較的単純なアルゴリズムにも関わらず広く使われているものらしい。実際に書いてみても、基本的な実装であればたしかにとてもシンプルだった。ただし、データの初期化をするところで一点考慮すべき内容があることにも気づいたので、それについても書く。 KMeans 法の具体的なアルゴリズムについてはサンプルコードと共に後述する。今回使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.3 BuildVersion

showyou 2018/03/08

あとで試す

*Python

リンク

Python: データセットの標準化について - CUBE SUGAR CONTAINER

今回は機械学習とか統計で扱うデータセットの標準化について。まずは、標準化されていない生のデータセットについて考えてみよう。それらの多くは、次元によって数値の単位がバラバラだったり、あるいは大きさが極端に異なったりする。これをそのまま扱ってしまうと、各次元を見比べたときにそれぞれの関係が分かりにくい。また、機械学習においては特定の次元の影響が強く (または反対に弱く) 出てしまったりすることもあるらしい。そこで、それぞれの次元のスケールを同じに揃えてやりたい。これを標準化というようだ。今回は「Zスコア」という標準化のやり方を扱う。これは、一言で言ってしまえばデータセットの各要素から平均を引いて、標準偏差で割ったもの。これをすると、データセットは平均が 0 で標準偏差・分散が 1 になる。使った環境は次の通り。 $ python --version Python 3.5.1

showyou 2018/03/08

*Python

リンク

アクセスキーのコミットを抑止できて安全便利な awslabs/git-secrets - kakakakakku blog

GitHub で awslabs のリポジトリを眺めてたら git-secrets という便利なツール（シェルで実装されてる）を発見した．どんなものかを簡単に説明すると，アクセスキーなどを誤ってコミットすることを Git の hooks を使って未然に防ぐツールで，誤って GitHub に push してしまったために，AWS を不正利用されてしまった，みたいな事故もたまに聞くし，そういうのを防ぐことができる．非常に良かったので，一部のリポジトリに git-secrets を設定した． github.com インストール make install でも良いけど，Mac なら brew が使える． $ brew install git-secrets インストールすると git secrets コマンドが使えるようになった． $ git secrets usage: git secrets

showyou 2018/03/08

リンク

統計検定 1 級に合格する方法 - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに: 統計学の重要性 NTT データ数理システムでリサーチャーをしている大槻 (通称、けんちょん) です。今回は統計検定 1 級について記します。統計検定とは日本統計学会による公認の資格であり、統計に関する知識や活用力を評価するものです。日常的に大量のデータが溢れている昨今、データ分析や機械学習に対するニーズは最高の高まりを見せています。最近では何も考えずともただデータを入力するだけでデータ分析や機械学習手法を実行してくれるツールも多数出回るようになりました。データ分析や機械学習を実際に遂行するにあたって、統計学は強力な基

showyou 2018/03/08

*あとで読む

リンク

脳はベイジアンなのに、なぜ正しく確率の計算ができないのか？ - Qiita

#脳がベイジアンだと思われる件私たちは、不確実な世界に生きています。ゴミをゴミ箱に投げてもなかなか入りません（私は）。これは、私の脳が、私とゴミ箱の物理的な距離と、ゴミの重さといった物理量、また私自身の運動機能といった、サクセスフルにゴミを投げ入れるために必要な計算事柄を、正しく計算できていないことを表しています。 **認知科学 (Cognitive Science)**の世界では、**ベイズ統計学 (Bayesian Statistics)**を用いて、人や動物の認知・行動をモデリングする試みがなされてきました。ベイズの利点はもちろん、行動の達成に必要な計算事項に関する不確実性 (Uncertainty)を、確率を用いて定量できることです。人や動物は、不確実な世界から情報を取得し、記憶や経験と組み合わせて行動を実行します。そのためベイズ統計学を使って主観的な不確実性を定量することは、行

showyou 2018/03/08

あとで試す

*Python

リンク

はてなブックマーク

タグ

2018年3月8日のブックマーク (6件)

Python と R の違い・関数の対応表

Python: KMeans 法を実装してみる - CUBE SUGAR CONTAINER

Python: データセットの標準化について - CUBE SUGAR CONTAINER

アクセスキーのコミットを抑止できて安全便利な awslabs/git-secrets - kakakakakku blog

統計検定 1 級に合格する方法 - Qiita

脳はベイジアンなのに、なぜ正しく確率の計算ができないのか？ - Qiita

お知らせ

今週のはてなブックマーク数ランキング（2025年2月第3週）

今週のはてなブックマーク数ランキング（2025年2月第2週）

月間はてなブックマーク数ランキング（2025年1月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス