統計に関するhat_0024_enaのブックマーク (40)

  • 機械学習の基礎知識としての数学 - learning.ikeay.net

    私がAI人工知能)や機械学習って難しいナーと感じるところは、数学の前提知識がある程度必要なところです。 GoogleからTensorflowが出たときに、私もいっちょやってみるかなんて思ったのですが、参考にした記事もなかなか難しくてあんまり理解できなかったのを覚えてます。途中まで理解出来てたのに、急に数式が出てきて「なるほどわからん!」ってなることが多かったですね。 「というかエンジニアなのに数学苦手なのw」とビックリされる方もいらっしゃると思いますが、エンジニアっつったって、今の御時世理系出身エンジニアばかりじゃないんです。でもエンジニア女子やってると自動でリケジョ扱いされるから面白いですね。 当面の目標としては、AIの中でも機械学習を学んでいきたいので(DeepLearningできるようになりたい!)、あると嬉しい数学の知識としては以下です。 線形代数 確率・統計 微分・積分 AI

    機械学習の基礎知識としての数学 - learning.ikeay.net
  • 機械学習の分類の話 · chezou/notebooks · GitHub

    機械学習の分類の話 · chezou/notebooks · GitHub
    hat_0024_ena
    hat_0024_ena 2016/05/11
    パーセプトロン、ロジスティックのイメージあり
  • 2.3 区間推定/信頼区間

    ←前へ | もくじ | 次へ→ 母集団から標を取り出して計算した標平均は、母平均の推定値として使うことができます。しかし、それは母平均にぴったり一致しているわけではありません。あくまでも推定値です。サンプルサイズが小さければ、標平均と母平均が離れている可能性が高くなりそうですし、逆に、サンプルサイズが大きければ、標平均と母平均とが近くなるような気がします。 そこで、母平均を、ある幅を持って推定しようということを考えます。これを「区間推定」と呼びます。「標から推定すると、母平均はこの値からこの値までの間にはいるのではないか」という形で推定をおこなうのです。 区間推定の考え方 区間推定の考え方を説明していきましょう。 まずポテトの母集団の分布を考えます。この分布が「正規分布」にしたがっているとします。正規分布というのは、下の図のように平均を山の中心として左右になめらかに広がった「つり

    hat_0024_ena
    hat_0024_ena 2016/04/10
     95% 母集団の平均を推定すること
  • [PDF]系列相関:DWについて

    hat_0024_ena
    hat_0024_ena 2016/03/26
     ダービンワトソン
  • 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料

    「第5回 プログラマのための数学勉強会 発表資料 (2015/11/21[sat])」 内容は統計学の素養がある方には基的な事項ですが、ベクトルと内積で見方を変えてみたという点と、あまり統計学に親しみがない方にも理解してもらえるようなまとめになっている、というところにスライドの独自性があると考えていますので、その辺り良ければご覧ください^^Read less

    「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
  • 404 - Minitab

    Minitab® サポート404 申し訳ありません。このページは使用できません。 再度開始 Minitab.comライセンスポータル店舗ブログお問い合わせCookie 設定Copyright © 2024 Minitab, LLC. All rights Reserved.

    hat_0024_ena
    hat_0024_ena 2015/10/17
    中心複合計画 Box-Behnken
  • 試作品の数を劇的に減らす直交配列実験の実務

    品質管理のための代表的な統計手法である実験計画法について、実践的な手法を短期間に習得したいと希望している読者に向けて、Excelを使って効率的に独学できるような解説を行う。 商品開発の品質管理の現場では、品質に影響するさまざまな要因の中から、最適な水準の組み合わせを決め、商品設計を行う必要があります。品質に影響すると考えられる要因が1つや2つであった時代は、古典的な実験計画法の知識で要因を特定することができたのですが、商品機能が複雑化した現在では、品質に影響する要因の数が増えたため、従来の方法では対応できない状況になっています。 具体的には、実験に必要な試作品の種類が膨大となり、実験自体が不可能になる状態や、できたとしても、かなりの月日が想定されるといった状態です。製品ライフサイクルが短くなった現在、従来の方法で実験を実施していては市場環境に対応できなくなりました。このような現場の問題解決

    試作品の数を劇的に減らす直交配列実験の実務
    hat_0024_ena
    hat_0024_ena 2015/10/17
     直行表 L()の表記の例とか
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

    hat_0024_ena
    hat_0024_ena 2015/10/17
     章の視点が大事 データから見つける のか データを集める のか …
  • 7.3 交互作用とは?

    ということは、「クリスピー、辛口は、単独で使うより、両方を使った方がよく、逆に、どちらかを使うくらいなら、普通のチキンの方がよい」ということが分かります。 上の結果を、あなたは店員さんに伝えました。 「そうか。それぞれを単独で売るくらいならやめて、両方を組み合わせて売ったほうがいいんだ。よし、辛口クリスピーチキンを売り出すことにするよ!」 交互作用の意味 交互作用の意味について、図式的に説明します。 交互作用のグラフは、縦軸に点数を、横軸に条件をとり、群別に平均点をとります。 下のグラフで、点数は表示されていませんが、a1、a2が要因Aによる群、b1、b2が要因Bによる群、●や■で表示されているのが平均点として読みとってください。 交互作用のない場合 まず、交互作用のない場合を見てみましょう。 交互作用のない場合のグラフは、グラフは平行になります。

  • 【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita

    統計をこれから学ぼうという方にとって、非常に重要な概念ですが理解が難しいものに「標準偏差」があると思います。「平均」くらいまでは馴染みもあるし、「わかるわかるー」という感じと思いますが、突如現れる「標準偏差」 の壁。結構、この辺りで、「数学無理だー」って打ちのめされた方もいるのではないでしょうか。 先にグラフのイメージを掲載すると、下記の赤い線の長さが「標準偏差」です。なぜこの長さが標準偏差なのか、ということも解き明かしていきます。 (code is here) 記事では数学が得意でない方にもわかるように1から標準偏差とはなにか、を説明してみようという記事です。 数式はわかるけど、イマイチ「標準偏差」の意味わからんという方にも直感的な理解がしてもらえるような説明もしていきますので、ぜひご覧ください。 (※ この記事では標準偏差の分母に $n$を使用しています。$n-1$を使用するケースも

    【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita
  • 【数学】固有値・固有ベクトルとは何かを可視化してみる - Qiita

    線形代数に固有値という概念が出てきます。最初はイメージしにくいのでは、と思うのですが重要な概念かつ、統計学でも頻繁に利用されるので、これもこの可視化シリーズとしてアニメーショングラフを書いて説明することを試みたいと思います。 このようなグラフの意味を読み解いていきます。 1.固有値・固有ベクトルとは? まず、固有値・固有ベクトルとはなんぞや。数式で表すと下記のことです。 ${\bf x}\neq {\bf 0}$の${\bf x}$で、行列Aをかけると、長さが$\lambda$倍になるような${\bf x}$の事を固有ベクトル, $\lambda$を固有値と言います。 知らない人は???で、これだけではよくわからないですね。 早速、グラフィカルな説明も交えて説明していきたいと思います。 2.行列Aによる線形変換 固有値・固有ベクトルの説明の前に、行列による線形変換について取り上げます。 例

    【数学】固有値・固有ベクトルとは何かを可視化してみる - Qiita
  • [ ネコでもわかるモンティホールジレンマ] by DOFI-BLOG どふぃぶろぐ

    ゲームや日記を公開中。 --- a blog about games, life. my handle is 'd_of_i'.

  • 統計の基本事項

    トップページ→研究分野と周辺→システムの評価→ 基統計量 平均(算術平均)値は、(データ値の総和)÷(データ数)となる。(或るデータの値)-(平均値)を、そのデータの偏差という。偏差の絶対値の大きいデータが多ければ、そのデータ群はばらつきが大きい。データ群のばらつきの大きさを単純に偏差の総和とすると、偏差には正負があるので相殺されてしまう。 そこで、各データの偏差を二乗する(こうすれば必ず正の値になる)。(各データの偏差の二乗の総和)÷(データ数)をそのデータ群の分散と呼び、ばらつきの大きさを表す。また、分散の平方根を標準偏差という。英語では偏差はDeviation、分散はVariance、標準偏差はStandard Deviationとなるので、標準偏差はS.D.と略記される事も多い。 統計の最も基的な量である基統計量としては、他に最大値、最小値、範囲(最大値-最小値)、中央値(デ

    hat_0024_ena
    hat_0024_ena 2013/06/25
     基礎
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 機械学習 はじめよう 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    機械学習 はじめよう 記事一覧 | gihyo.jp
    hat_0024_ena
    hat_0024_ena 2011/11/24
     基底関数を使った回帰式の説明
  • - 北海道大学理学院自然史科学専攻科学コミュニケーション講座科学基礎論研究室

    第一日・因果性をめぐる哲学的議論のまとめ 第一日目の授業前半では、後半のモデル構築の話の背景となる、哲学的議論が紹介された。具体的には因果に関する伝統的な哲学的議論、確率・統計にかかわるさまざまな科学哲学上の議論を取り上げ、理論選択やモデルについての哲学的議論が行われた。 伝統的な哲学議論としては以下のトピックが取り上げられた。 デカルト以前の哲学(目的論)デカルトの懐疑帰納の問題1 ヒュームの議論帰納の問題2 グッドマンの議論(grueのパラドックス) 確率統計にかかわる哲学としては以下のトピックを中心に議論が行われた。ベイズ主義尤度主義エラー統計モデル選択基準AIC, BIC 科学は個別の観察から、世界について確かな知識を得ようとする活動である。講義では、この知識をめぐるこれまでの様々な哲学的議論について、それらが知識の「信頼性(reliability)」の基準をどう捉えてきたのか、ま

    hat_0024_ena
    hat_0024_ena 2011/08/28
    aic 赤池情報量基準 最大対数尤度とパラメータ数を含んだ指標で、尤度が大きく(適合度が高い)、パラメータ数が少ない(単純)モデルでより小さい値をとる。
  • 統計学自習ノート

    多変量解析 回帰分析(あてはめ),判別分析,主成分分析,因子分析, SEM 数量化 I 類,数量化 II 類,数量化 III 類,数量化 IV 類 正準相関分析,クラスター分析,主座標分析 クロンバックの $\alpha$ 信頼性係数 生存率解析 Cutler-Ederer 法による生命表,Kaplan-Meier 法による生命表 多重ロジスティックモデル,Cox の比例ハザードモデル

  • トヨタが気前よくカイゼンを教える本当の理由(1/3) ― @IT MONOist

    マイクロソフトは「Microsoft AI Tour-Tokyo」を開催した。稿では、マイクロソフト エグゼクティブバイスプレジデント兼チーフマーケティングオフィサーの沼健氏の基調講演と、その後に行われたメディアラウンドテーブルの内容を紹介する。

  • ラテン方格法による実験配置方法

    1.ラテン方格法での実験配置 ラテン方格法では処理の水準と同じ数だけのブロックの水準をそれぞれ必要とします.例えば,入浴剤の例では入浴剤が3種類,すなわち3水準の処理であれば,被験者のブロックも浴槽のブロックも3水準が必要です.そして,考えつく限りのラテン方格からランダムに1つのラテン方格を選んで実験を配置します. しかし,実際には2×2のラテン方格は2つしかないのに対し,5×5になると161280個もありますから,下のように標準方格を1つ書き出し,その列と行をそれぞれ無作為化して,入れ替えることによって,ランダムなラテン方格を選ぶのが一般的な方法です.

  • http://www5.ocn.ne.jp/~crachica/ziyuu-k/keikaku/keikaku.html

    「新素材を作るため、ある物質に添加剤a,b,c,dを混ぜて実験し、最も良い組み合わせを見つけたい。 添加剤の量を、aは4通り、b,c,dはそれぞれ3通りとするとき、少ない実験回数でその組み合わせを見つけるには、どうしたら良いだろうか?」 この場合、組み合わせは108通りもあるので、とても全部はやっていられません。 しかし実験回数を減らして実験する組み合わせが偏ってしまったら、良い組み合わせを見逃してしまうかもしれない。 そこで、良い組み合わせを見逃さないように、網をはった「実験の組み合わせ」を考える「実験計画法」の登場となります。 まずは簡単な例から。 「a,bが各々5通りのとき、5回の実験で最適の組み合わせがどこにあるか予想するためには、どのような組み合わせで実験しますか?」 a,b各々5通りなので、組み合わせは下図のように全部で25通りあります。 これに網をはろうとするなら、(

    hat_0024_ena
    hat_0024_ena 2011/07/17
    実験計画のサンプル