タグ

統計に関するblogger323のブックマーク (13)

  • 日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)

    2008年に日統計学会75周年記念出版として刊行されました国友直人・山拓監修『21世紀の統計科学』(全3巻)の増補版を, 日統計学会のホームページを通じて提供することとなりました.書の増補版の オンライン公開が統計科学の今後の発展に資することを期待しております. 第I巻 社会・経済の統計科学 (国友直人・山拓編) 第II巻 自然・生物・健康の統計科学 (小西貞則・国友直人編) 第III巻 数理・計算の統計科学 (北川源四郎・竹村彰通編)

  • 統計数理研究所学術研究リポジトリ

    ・2020年1月27日 統計数理研究所 創立記念講演会・公開講演会タイトルリスト(1955-1992)を登録しました。 ・2019年12月19日 「物理的さいころシミュレータ」,「講義: 棒グラフ, ヒストグラム そして 統計学」を登録しました。

  • 食べログ3.8問題に終止符を打つ

    import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import json import glob import math from pathlib import Path from collections import Counter from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix from sklearn.metrics import roc_auc_score from sklearn.model_selection imp

  • 統計検定:Japan Statistical Society Certificate

    統計検定」とは、統計に関する知識や活用力を評価する全国統一試験です。問い合わせ:統計検定センター

  • ネットのアンケートは世論調査の名に値しない|三春充希(はる) ⭐第50回衆院選情報部

    世論調査の結果が政権にとって厳しくなってくるにつれて、ますますネットではそれに反発した「内閣支持率アンケート」が熱気を帯びています。そうした世論調査を否定したい人たちの憩いの場を侵害するつもりは毛頭ないのですが、それを見て誤った認識を持つ人がでないようにネットのアンケートは世論調査の名に値しないと書いておくことにします。 「時として10万人規模の回答数となるネット調査だと、安倍政権の支持率は8割を超える。旧来的な電話調査は信頼性に疑問がある」と記事に書いてしまったケント・ギルバート氏のように、ネットのアンケートをとりあげる人たちは「回答数の多さ」を持ち出します。しかしケント・ギルバート氏にもぜひ知ってもらいたい話なのですが、実は日の有権者約1憶人を対象にして内閣支持率を調査する目的では10万人規模の回答を集める必要はありません。多ければいいというわけではないのです。それはスープの味見をす

    ネットのアンケートは世論調査の名に値しない|三春充希(はる) ⭐第50回衆院選情報部
  • 1万票差でも当選確実が出せるワケ - ゆとりずむ

    こんばんは。最近めっぽう暑くて困ってしまいますね。 暑いといえば、こないだの大阪都構想選挙は予想以上にアツい戦いとなりましたね。関係者でもないのに、ハラハラしながら見てしまいました。ところで、開票速報を見ていて、いきなり『多数確実』と表示されてびっくりしたのは、わたしだけではないかと思います。 こんなに接戦な上に、どうして残り19%も未開票なのに、多数確実なんだろう?ヽ(`Д´)ノ と思われた方も多いのでは無いでしょうか?? そこで、今回はいわゆる『当選確実』がどのように出るのかについて、考えてみました。 『当選確実』の統計学 開票速報を行い、投票数の50%を取れば、他の票全てが反対側に回っても結果が覆ることは無いため、『当選確定』と言えます。一方、『当選確実』はこれまでのデータから、他の票数の動きを予想しても『ほぼ間違い無いでしょう』といえる状態です。 統計の世界では、『少ないサンプルか

    1万票差でも当選確実が出せるワケ - ゆとりずむ
  • R言語の過去と最新の動向

    連載「フリーソフトによるデータ解析・マイニング」は今月号をもって終了となります。 2003年8月に連載第1回として金明哲氏による「データ解析・マイニングとR言語」という記事が掲載されて以来、 約12年半149回に渡り、6名の執筆陣がR言語とデータ解析について解説してきました。 最終回となる今回は、過去10年余りのR言語の国内での普及、 そしてR言語の最新の動向について紹介しながら、有用な情報をピックアップしてみます。 なお今回の記事には著者の主観が多分に反映されていることをご承知おき下さい。 R言語の10余年史 コンピュータのバックアップ履歴を漁ってみたところ、著者自身は大学院生だった2003年頃からRを触り始めて、 2004年夏頃に研究のための分析ツールとしてRを導入していたようです。 この頃のRのバージョンは1.7から1.8だったように記憶しています。 連載の開始時期と著者のR利用

  • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

    追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

    データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
  • Google Books Ngram Viewer

    <iframe name="ngram_chart" src="" width=900 height=500 marginwidth=0 marginheight=0 hspace=0 vspace=0 frameborder=0 scrolling=no></iframe> Part-of-speech tags cook_VERB, _DET_ President Wildcards King of *, best *_NOUN Inflections shook_INF drive_VERB_INF Arithmetic compositions (color /(color + colour)) Corpus selection I want:eng_2019

  • 東大日次物価指数サイト

    お知らせ2020年7月14日 東京大学と・IMF(国際通貨基金)共催webinar「新型コロナウイルス・パンデミック下の世界経済見通し」を2020年7月10日に開催しました。2019年1月10日 特許「物価指数推定装置、物価指数推定プログラム及び方法」について 特許第6395307号(P6395307)「物価指数推定装置、物価指数推定プログラム及び方法」(出願番号: 2014-231511,公開番号: 2016-095681,登録番号: 6395307)出願日2014/11/14,公知日2016/05/26,登録日2018/09/07.出願人:国立大学法人東京大学,発明者:渡辺努,渡辺広太.2017.10.13 東大日次物価指数プロジェクトは,日学術振興会・科学研究費・基盤研究S「長期デフレの解明」の研究活動の一環として行っているものです。このたび同プロジェクトの研究進捗評価(検証)があ

  • そもそもビジネスの現場ではどういう「レベル」の統計学を使うべきなのか - 渋谷駅前で働くデータサイエンティストのブログ

    データサイエンティストブームが去りつつある一方で、データ分析ブームそのものはじわじわと広がり続けている感じのする昨今ですが。最近また、色々なところで「当にビジネスやるのに統計学って必要なの?」みたいな話題を聞くことが増えてきたので、何となくざっくりまとめて書いてみました。 ちなみに今回の話題の参考図書を挙げようと思ったら、この辺ですかね。 とある弁当屋の統計技師(データサイエンティスト) ―データ分析のはじめかた― 作者: 石田基広,りんと出版社/メーカー: 共立出版発売日: 2013/09/25メディア: 単行この商品を含むブログ (13件) を見る 統計学入門 (基礎統計学) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メディア: 単行購入: 158人 クリック: 3,604回この商品を含むブログ (78件) を見る 当は赤

    そもそもビジネスの現場ではどういう「レベル」の統計学を使うべきなのか - 渋谷駅前で働くデータサイエンティストのブログ
  • 統計の基本事項

    トップページ→研究分野と周辺→システムの評価→ 基統計量 平均(算術平均)値は、(データ値の総和)÷(データ数)となる。(或るデータの値)-(平均値)を、そのデータの偏差という。偏差の絶対値の大きいデータが多ければ、そのデータ群はばらつきが大きい。データ群のばらつきの大きさを単純に偏差の総和とすると、偏差には正負があるので相殺されてしまう。 そこで、各データの偏差を二乗する(こうすれば必ず正の値になる)。(各データの偏差の二乗の総和)÷(データ数)をそのデータ群の分散と呼び、ばらつきの大きさを表す。また、分散の平方根を標準偏差という。英語では偏差はDeviation、分散はVariance、標準偏差はStandard Deviationとなるので、標準偏差はS.D.と略記される事も多い。 統計の最も基的な量である基統計量としては、他に最大値、最小値、範囲(最大値-最小値)、中央値(デ

  • Open DATA METI | 経済産業省のオープンデータカタログサイト

    サイトは経済産業省がオープンデータを実践するために設置した試験サイト(β版)です。サイトは、データ活用に関心がある企業、NPO、個人等の方々から色々な意見をいただくことで、少しでも使い勝手の良いサイトにしていくとともに、個人情報等に配慮した上で、経済省のみならず政府全体におけるオープンデータ推進の検討に活用させていただくことも考えております。そのため、サイトでは、ユーザーの方々から様々な意見や要望をいただき、対して様々な意見や要望をいただく仕組みの一つとして、「DATA METI活用パートナーズ」を設置しております。この「DATA METI活用パートナーズ」の概要と申込についてはこのページのとおりとなりますので、御関心のある方は是非ご覧下さい。 なお、いただいたコメントを踏まえ、柔軟な修正を逐次していくことを考えております。そのため、利用規約も含め、予告無くサイトは変更される可能性

  • 1