[B! math] [2ページ] lilpacyのブックマーク

lilpacy id:lilpacy

mathに関するlilpacyのブックマーク (27)

tota | 統計学/R on Twitter: "基本の確率分布・標本分布（復習用）。これだけでもお腹いっぱいになりますね。 https://t.co/heyZRUKovr"
lilpacy 2021/03/26
math

statistics

diagram
リンク
杉本啓 on Twitter: "昔、設計やプログラミングを哲学に結びつけるのが嫌いだったが、さほどでもなくなった。オブジェクト指向のクラス概念をプラトンのイデアに直に結び付けたりするノリは今でも嫌いだが、設計における概念の切り分けには哲学も役立つと感じる。結… https://t.co/dElkiBEdns"
lilpacy 2021/03/21
哲学

math
リンク
中心極限定理の意味。サイコロの具体例から分かる確率分布の正規近似 | アタリマエ！
日本全国の20代男性の平均身長を知りたい場合、何百万といる20代男性全員のデータを集めるのは、時間とコストがかかりすぎてしまうので現実的ではありません。代わりに使われているのが、無作為に選んだ数百人のデータを集めて「その数百人の20代男性の平均身長 \(\overline{X}\)」を「日本全国の20代男性の平均身長 \(μ\) の推定値」として利用する方法です。ただ、この方法には1つ懸念材料があります。それは、「たまたま身長の高い人ばかりを調査してしまったら、真の平均から大きく離れた統計結果になってくるのではないか？」ということ。このような不安を抱えたままでは、せっかく得られた統計結果をどのくらい信頼していいか分かりません。そこで重要になってくるのが、「真の平均からどのくらい誤差のある統計結果になる確率がどのくらいあるのか」を知ることです。例えば「無作為抽出によって得られる平
lilpacy 2021/03/16
math

statistics
リンク
無料、独学で機械学習エンジニアになる！~機械学習が学べる無料サイト、書籍~ - Qiita
こんにちはkamikawaです今回は無料で利用できる機械学習、データサイエンスに関するサイトや書籍をまとめました私自身も機械学習プロジェクトに関わった経験があるのですが、ここに載せたサイトや資料を勉強に使っていました機械学習エンジニアを目指す人必見です入門者レベル〜応用・発展レベルまで幅広く載せていますレベルは個人の見解です。(あくまでも参考程度に) 日本語のものと英語のものを紹介します海外の大学の講義もあるので英語の勉強にも使えます海外でのキャリアを考えている方も必見です対象読者機械学習を学びたいけどお金をかけたくない人独学で機械学習を身につけたい人機械学習エンジニアになりたい人発展的な機械学習を学びたい人日本語 Python 三重大学奥村教授のサイト機械学習、様々な分析、スクレイピング、データ可視化、地図データ、CV、統計など幅広い分野を扱っている R編もある
lilpacy 2021/03/08
curriculum

ml

math
リンク
https://twitter.com/ogawa_yutaro_22/status/1360735147117539328
lilpacy 2021/02/14
statistics

データサイエンス

機械学習

math
リンク
9 Distance Measures in Data Science
Distance Measures. Image by the author.Many algorithms, whether supervised or unsupervised, make use of distance measures. These measures, such as euclidean distance or cosine similarity, can often be found in algorithms such as k-NN, UMAP, HDBSCAN, etc.
lilpacy 2021/02/14
diagram

統計学

機械学習

データサイエンス

math
リンク
固有値・固有ベクトルの使いみち（１．主成分分析） - Qiita
現代はビッグデータの時代と言われて久しいですが、「データが大きい」と一口に言っても、２種類の大きさがあります。データの次元とサンプルサイズ（N数）です。例えば、「全人類の身長と体重のデータ」なら「次元が小さいけどNが大きいデータ（次元は2、N＝70億）」ですし、「１０人分のゲノム配列データ」なら「次元が大きいけどNが小さい（次元は60億、N＝10）」と言えるでしょう。サンプルサイズがデータの次元より小さいというのは、一般的にデータが不足している状況であり、あまり好ましくありません。たとえば変数の間にある関係を捉えることが難しくなります（回帰における劣決定問題）。しかし、多次元・多変数のデータにおいて、すべての変数が意味を持つということも稀です。幾つかの変数は単に「意味を持たないただのノイズ」だったりします。ゲノムの例でいうと、ヒトゲノムのおよそ97%は無意味なジャンクDNAであると言わ
lilpacy 2021/01/13
あとで読む

主成分分析

math
リンク
前のページ 1 2

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx