タグ

statisticsに関するHashのブックマーク (81)

  • Jake Vanderplas - Statistics for Hackers - PyCon 2016

  • 政府統計の総合窓口(e-Stat)のAPIを使ってみよう [R編] - Qiita

    はじめに Qiita Rアドベント に政府統計ポータル(e-Stat)と R でサンタさんの12月の出費動向を調べてみたという良記事がありました。 とても参考になるのですが、ポータルからマウスで項目をクリックしていくのが大変です。特に最後の方のフェーズではページが強制的にフルスクリーンになってしまい、上記アドベントの操作を確認できなくなります。 そこでAPIを使ってみます。 その前に、e-Stat API を少し触ってみましょう。 公式説明PDFをパクる 恐れおおくも総務省統計局統計センター様謹製PDF の最後の事例をパクります。 RCurl でjson形式のデータを引っ張ってきます。次世代統計システムから取得した自分のアカウントが必要です。以下のコードで yourAPPID の部分を取得したID に変更してください。 さらに加えて、統計表IDや分類表IDが必要なんですが、後述します。 >

    政府統計の総合窓口(e-Stat)のAPIを使ってみよう [R編] - Qiita
  • なぜ無作為化なのか:『因果推論の根本問題』とその解法 - Take a Risk:林岳彦の研究メモ

    こんにちは。林岳彦です。はてなジョシュ(バーネット)です。今回から「はてなブログ」へ引っ越しました。今後とも引きつづきよろしくお願いします。 さて。 前回までの記事では、実験データではない調査観察データを用いた因果効果の推定における注意すべきバイアスの類型について書いてきました。 ここでなぜわざわざ「実験データではない」という但し書きをつけているのかというと、適切なデザインに基づき行われた実験(もしくは介入を伴う調査)からのデータは、処理・条件の違いによる結果の差を素直に「因果効果」とみなして解釈できるので、余り細かいことを考えなくても大丈夫だからです*1。 はい。 では、そもそも、なぜそのような実験では「結果の差を素直に因果効果とみなせる」のでしょうか? 今回は、その背景となるロジックについて書いていきたいと思います。 (すみません今回もものすごく長いです。。。) まずは「因果効果」を定

    なぜ無作為化なのか:『因果推論の根本問題』とその解法 - Take a Risk:林岳彦の研究メモ
    Hash
    Hash 2015/09/04
    わかりやすい
  • K-meansクラスタリングで何かつくる

    DOWNLOAD THIS BOOKS INTO AVAILABLE FORMAT (Unlimited) ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { https://tinyurl.com/yyxo9sk7 } ........................................

    K-meansクラスタリングで何かつくる
  • The p value and the base rate fallacy — Statistics Done Wrong

    The p value and the base rate fallacy¶ You’ve already seen that p values are hard to interpret. Getting a statistically insignificant result doesn’t mean there’s no difference. What about getting a significant result? Let’s try an example. Suppose I am testing a hundred potential cancer medications. Only ten of these drugs actually work, but I don’t know which; I must perform experiments to find t

  • 「統計数理」既刊目次

    各論文の全文pdfをご覧いただけます。 pdfを公開しているものについては、著作権は統計数理研究所に帰属します 第71巻 第1号 ,第2号 (2023年) 第70巻 第1号 ,第2号 (2022年) 第69巻 第1号 ,第2号 (2021年) 第68巻 第1号 ,第2号 (2020年) 第67巻 第1号 ,第2号 (2019年) 第66巻 第1号 ,第2号 (2018年) 第65巻 第1号 ,第2号 (2017年) 第64巻 第1号 ,第2号 (2016年) 第63巻 第1号 ,第2号 (2015年) 第62巻 第1号, 第2号 (2014年) 第61巻 第1号, 第2号 (2013年) 第60巻 第1号, 第2号 (2012年) 第59巻 第1号, 第2号 (2011年) 第58巻 第1号, 第2号 (2010年) 第57巻 第1号, 第2号 (2009年) 第56巻 第1号, 第2号

    Hash
    Hash 2015/03/15
    これだけのコンテンツが無料で読めるとは...
  • GitHut - Programming Languages and GitHub

    Top active languages A split by language view of active repositories GitHut is an attempt to visualize and explore the complexity of the universe of programming languages used across the repositories hosted on GitHub. Programming languages are not simply the tool developers use to create programs or express algorithms but also instruments to code and decode creativity. By observing the history of

    GitHut - Programming Languages and GitHub
  • Tyler Vigen's personal website

    Tyler Vigen's project list Spurious Scholar Published: January 27, 2024 What it is: Thousands of AI-generated academic research articles based on the correlations from the spurious correlations project Spurious Correlations Originally published: May 2014 Update launched: January 27, 2024 What it is: Random correlations dredged up from silly data, turned into linear line charts. Now with AI-generat

    Tyler Vigen's personal website
    Hash
    Hash 2015/01/21
    無意味な相関データをそれっぽく見せていくサイト. 発想がいいな...
  • パソコン工房のPCで遊ぼう第2弾! あんちべさんと一緒に Rakuten MA で形態素解析 - はてなニュース

    (これまでのあらすじ)前回、パソコン工房から「統計処理用のPCのPR企画をやりたい」と依頼を受けて、はてなエンジニアと一緒にword2vecで遊んでみた編集部。読者の皆さまにも好評だったので、調子に乗って第2弾を実施することにしました。今回は「"word2vec"で艦これ加賀さんから乳を引いてみる」で一世を風靡した、あの統計屋さんが全面協力です! 記事の最後にはプレゼントのお知らせも。 (※この記事は株式会社ユニットコムによるPR記事です) 皆さまは前回の記事を、覚えておりますでしょうか? ▽ Python - Perl + Java = ? はてなブログのデータとパソコン工房のPCを使って「word2vec」で遊んでみた - はてなニュース パソコン工房の統計処理用PC × はてなブログのデータ × word2vec という記事でした。ブックマークコメントから感想をいくつかピックアップし

    パソコン工房のPCで遊ぼう第2弾! あんちべさんと一緒に Rakuten MA で形態素解析 - はてなニュース
  • 正規分布

    正規分布 測定誤差のバラツキや社会現象あるいは自然現象の中に現れるバラツキの多くは釣鐘型をした正規分布であることから、この分布は統計学の中でも最も重要で応用性の広い分布です。母集団が正規分布に従っているとき、これを正規母集団と呼び、その母平均を、母分散を(母標準偏差はしたがって)としたとき、一般になる記号で表します。正規分布の形状は、下図のように、母平均を中心として左右対称になった釣鐘型形状をしており、その関数の変曲点までの距離がちょうど母標準偏差となっています。確率変数の実現値である変数の出現確率を示す式を確率密度関数と呼び、それをとしますと、正規分布の確率密度関数は となります。 このように関数は確率変数の他には母平均と母分散しか含まず、またこの母平均と母分散がその関数の形状を特徴づけていることから、正規母集団の母数として母平均と母分散が選ばれます。関数を確率変数の全領域で積分した値は

    正規分布
  • http://www012.upp.so-net.ne.jp/doi/biostat/CT39/distribution.pdf

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • カイ二乗検定に関するメモ - 再帰の反復blog

    カイ二乗検定って何でああいう形の式 を使うのか?という疑問について。 検定について カイ二乗検定自体の前に、検定一般について必要そうなことを書いておく(そもそも統計一般がすごくわかりにくい気がしてしょうがない。「帰無仮説」とか「有意」みたいな用語も、わざとわかりにくくするために使っているんじゃないかとすら思う)。 統計的検定は、科学における反証手続きに何となく似ているので、それと比較してみる。 反証 AならばB。 でもBでは無かった。 したがってAではない。 というのが反証の基構造。例をあげると次のような感じ。 ニュートン力学が正しい ならば、○○の時刻に××の位置に惑星が観測される。 でも違う位置で観測された。 したがってニュートン力学は間違っている。 もちろん実際には前提Aにあたる部分には「ニュートン力学が正しい」以外の様々な仮定が置かれているので、Bで無かったとしても前提のどの部分

    Hash
    Hash 2014/11/20
    議論の流れがわかりやすい
  • 認証がかかっています

    こちらのブログには認証がかかっています。 ユーザー名 パスワード Powered by Seesaa

    Hash
    Hash 2014/11/10
    中心極限定理を適当なデータを元にRでサンプリングして正規分布になることを確認してる. よい
  • ときわ台学/統計学/カイ二乗分布

    標準正規分布に独立に従うn個の確率変数をそれぞれ二乗して足し合わせて作られる確率変数,Z=X12+・・・+Xn2 の従う分布を自由度nのカイ二乗分布という。これは標分散値の分布,すなわち,標分散値が「標値のバラツキ」を示す量と考えれば,「標値のバラツキ」がいろいろな標ごとにどのようにバラツくかを示している”理想極限的”分布ということができる。 たとえば,人口1億人の中から全日経済新聞社がある1000人のグループを選び出し,この大きさ1000の標についての身長を調べ,その標の標平均値,標分散値を計算することができるだろう。一方,フジエダ電子出版社も負けずに無作為に別途,1000人のグループを選び出し,同様な計算を行うこともできる(ホントか?)が,その標平均値,標分散値は先のものとは一般的には異なる。さらに別のシンクタンクも大きさ1000の標を選び出し,統計値を同様に

    ときわ台学/統計学/カイ二乗分布
  • 授業/H18/進化生物学I/系統推定の基本用語 - 千葉大系統分類

    M E N U 研究室関係ページ 研究室メンバー 分子系統学実験 ▶日誌(仕事日更新) ▶接続不良from学外 授業関係ページ 授業/H17 授業/H18 データベース BGPlants植物園系統保存 YList和名・学名検索 YList掲示板 リンク 電子Journal(学内のみ) 日植物学会HP 生物科学ニュース 閲覧制限ページ? ("制限"付きページには) (関係者以外入れません) English Page    最新の10件 系統樹 † 英語のカタカナ書きで使われる用語が多い。 系統樹 Phylogenetic tree, Tree 節(ノード、分岐点、node)と枝(ブランチ、branch)からなる図。幹や枝を持つ樹木なような形状で描かれることが多いので、系統樹と呼ばれる。生物同士の類縁関係や遺伝子同士の類縁関係を図示するのに使われる。 「節」は、「種」(あるいはより上

    Hash
    Hash 2014/10/28
    どうも考えうる系統樹の数の一般項が間違っているような気がする
  • 受信者操作特性 - Wikipedia

    英語版記事を日語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、{{翻訳告知|en|Receiver operating characteristic|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より

    受信者操作特性 - Wikipedia
  • クラシックな機械学習の入門  8. クラスタリング

    3. 観測データ点を多次元空間中の点と定義 そこで2つの問題 各次元は観測データ点からどのように定義するか 次元のことをfeatureあるいは素性(そせい)と呼ぶ この問題をfeature design :素性設計と呼ぶ。例えば、  2つの素性の比を新たな素性とする ex 身長/体重  2つの素性の連続したもの ex 日・銀行、 日・沈没、 しかし、これは個別適用分野に応じて工夫すべし。 多次元空間における2点間の距離の定義 ユークリッド距離ばかりではないのだ! 距離の定義 5. 距離あるいは類似度の定義 1     が定義できる。えば、成分の生起確率だと思番目のが 擬距離) ユークリッド距離 係数(類似度) 係数(類似度) 内積と書くと 類似度 KLkw wwKLdivergenceKL wwwwwwDist ww ww wwDiceDice ww ww

    クラシックな機械学習の入門  8. クラスタリング
  • 情報検索 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "情報検索" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2024年3月) 情報検索(じょうほうけんさく、英語: information retrieval)とは、コンピュータを用いて大量のデータ群から目的に合致したものを取り出すこと。検索の対象となるデータには文書や画像、音声、映像(動画)、その他さまざまなメディアやその組み合わせとして記録されたデータなどが含まれる。インターネットの発達により検索はインターネットを介して行われることも多いが、ここでは情報を検索[1]するためのコンピュータ側における仕組みを記述している。 情報検索に対

    情報検索 - Wikipedia
  • Binary classification - Wikipedia