stibbarのブックマーク / 2017年10月22日

stibbar id:stibbar

2017年10月22日のブックマーク (7件)

交差検証 - Wikipedia
交差検証（交差確認）[1]（こうさけんしょう、英: cross-validation）とは、統計学において標本データを分割し、その一部をまず解析して、残る部分でその解析のテストを行い、解析自身の妥当性の検証・確認に当てる手法を指す[2][3][4]。データの解析（および導出された推定・統計的予測）がどれだけ本当に母集団に対処できるかを良い近似で検証・確認するための手法である。最初に解析するデータを「訓練事例集合（training set、訓練データ）」などと呼び、他のデータを「テスト事例集合（testing set、テストデータ）」などと呼ぶ。交差検証はSeymour Geisserが生み出した。特にそれ以上標本を集めるのが困難（危険だったり、コストがかかったり）な場合は、データから導いた推定は、交差検証などで慎重に裏付けを確認するべきである。交差検証の主な種類[編集] ホールドアウ
stibbar 2017/10/22
http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.KFold.html

wikipedia

data-science

cross-validation
リンク
京都光華女子大学・京都光華女子大学短期大学部
農林水産省近畿農政局と大阪ガスネットワーク（株）主催「Cooking Challenge!! 2023」にて管理栄養士専攻3年生のチームが「銅賞」を受賞しました
stibbar 2017/10/22
https://hitorimarketing.net/tools/correlation-analysis.html

correlation

data-science

pearson-correlation
リンク
共分散の意味と簡単な求め方 | 高校数学の美しい物語
共分散は，「XXX の偏差 × YYY の偏差」の平均で定義されます。 ※偏差とは平均との差のことです。定義だけでは共分散の意味は分かりにくいので，簡単な具体例で計算してみます。 555 人でテストを受けたデータを考える。 X:X:X: 国語の点数，YYY :数学の点数。各々の点数は，(50,50),(50,70),(80,60),(70,90),(90,100)(50,50),(50,70),(80,60),(70,90),(90,100)(50,50),(50,70),(80,60),(70,90),(90,100) このときの共分散を計算してみましょう。まず，国語の平均点 μX\mu_XμX は， μX=15(50+50+80+70+90)=68\mu_X=\dfrac{1}{5}(50+50+80+70+90)=68μX=51(50+50+80+70+90)=68
stibbar 2017/10/22
covariance

data-science

mathematics
リンク
統計の問題を Python で実際に計算してみる - Qiita
プレジデントオンラインに統計の記事が掲載されていました。朝食や出社時間と、営業成績に「相関関係」はあるか？ http://president.jp/articles/-/12416 上記の記事では確かに数式は出てこないのでとっつきやすく解説は詳しいので統計の入門にはピッタリです。しかしながらエクセルで手計算することが前提になっておりこれは若干億劫です。そこで今まで利用してきた Python でこれらの問題を計算してみたいと思います。問題とその解法問題の内容としては各社員の、朝食を食べてきた確率 (= 朝食率) 、出社時間、それに対して営業成績を 3 つの変数として相関関係があるか調べるというものです。このように変数の間の相関関係を調べるというのはさまざまな統計の基本とも言えるでしょう。計算機で扱えるように、それぞれの変数を X Y Z としましょう。まずはこれをCSV ファイルの
stibbar 2017/10/22
https://blog.apar.jp/data-analysis/2822/

qiita

data-science

python

pandas
リンク
pythonで美しいグラフ描画 -seabornを使えばデータ分析と可視化が捗るその1 - Qiita
Pythonでのグラフ描画 Pythonチャートを描く場合の定番は「matplotlib」ですが、その見た目のやや野暮ったい感じと、表記法のややこしさが指摘されています。そこで、この記事ではMatplotlibの機能をより美しく、またより簡単に実現するためのラッパー的存在である、「Seaborn」の使い方を取り上げます。 ◆ Overview of Python Visualization Tools http://pbpython.com/visualization-tools-1.html 上記の記事ではMatplotlibとSeabornについて下記のように書かれています。 matplotlibについて Matplotlib is the grandfather of python visualization packages. It is extremely powerful b
stibbar 2017/10/22
http://own-search-and-study.xyz/2017/05/02/seaborn%E3%81%AE%E5%85%A8%E3%83%A1%E3%82%BD%E3%83%83%E3%83%89%E3%82%92%E8%A7%A3%E8%AA%AC%EF%BC%88%E3%81%9D%E3%81%AE%EF%BC%91%EF%BC%9A%E3%82%B0%E3%83%A9%E3%83%95%E4%B8%80%E8%A6%A7%EF%BC%89/

qiita

python

data-science

seaborn
リンク
日本資金決済業協会、「資金決済に関する法律前払式支払手段の発行のしおり（第6版）」の販売開始 | gamebiz
日本資金決済業協会は、10月6日、「資金決済に関する法律前払式支払手段の発行のしおり（第6版）」を発行した。定価は3000円（会員は1000円）。本書は、「資金決済に関する法律」の解説や、登録・届出等実務面の手引書。「資金決済に関する法律・前払式支払手段」の概要を解説することを目的としたもので、財務局への登録申請・届出、発行保証金の供託に関する手続、払戻しに関する手続等について図表を用いて説明しているという。また、関係法令及び届出等に必要な各種様式を掲載しているとのこと。案内
stibbar 2017/10/22
gamebiz

fund-settlement

law
リンク
国内外のトップランカーが語るデータマイニングコンペの勝ち方～PyData.Tokyo Meetup #6、7イベントレポート
こんにちは、PyData.Tokyoオーガナイザーのシバタです。ボストンに向かう飛行機の中でこの記事を書き始めました。私事ですが、昨年12月よりDataRobot,Inc（下記「データロボット社」）という会社で働き始めました。今回は昨年10月に行われたPyData.Tokyo Meetup #6と今年2月に行われたPyData.Tokyo Meetup #7でのデータマイニングコンペをテーマに行った勉強会の様子をお伝えしたいと思っています。実はデータロボット社は多数のコンペ入賞者が働いていることで知られており、2つの勉強会に非常に関連の深い会社です。 DataRobot,Inc PyData.Tokyo Meetup #6 PyData.Tokyo Meetup #7 PyDataではこれまで機械学習や深層学習などデータ分析関連技術をテーマ別に扱ってきましたが、今回のテーマは、技術というよ
stibbar 2017/10/22
machine-learning

kaggle
リンク
- 2017年10月26日
- 2017年10月22日
- 2017年10月21日