タグ

統計に関するhayato34のブックマーク (11)

  • RIETI - ビッグデータが迫る研究開発の変革

    最先端の研究開発現場からビジネスまでのありとあらゆる場面で大きな変革―第四のパラダイムと呼称されることが多い―が起きつつある。それは、この一、二年"ビッグデータ"と総称される、質的に極めて多様で膨大な量のデータ群を有効利用することにより、地球から人間にいたるまで様々な対象をモデル化し、目的に応じた、より良い予測情報やサービスを提供する研究開発手段の台頭である。ビッグデータの取扱に必須の基幹的な科学技術は、巨大データベースに関わる工学領域をはじめとして、統計科学、数理工学、機械学習、データマイニングといった、日では人材が量的に不足している研究分野で生まれている。 このBBLセミナーでは、ビッグデータを取りまく日米の現状を概説するとともに、ビッグデータの利活用を阻む日独自の問題点について論じてみたい。 昨今、データを取り巻く環境が激変しています。以前はデータの質・量ともに不足しており、地球

    hayato34
    hayato34 2012/05/30
    "ビッグデータとは、そのままでは単なるゴミの山のようなものであり、分別や整理などの手間ひまをかける必要があります。"
  • 調査の結果|海外事業活動基本調査|経済産業省

    hayato34
    hayato34 2011/11/02
    ここから業種別海外取引高比率を求められる?
  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • 言語研究者のための統計の学び方―基礎を身につける|Colorless Green Ideas

    総和 総和と言っても、ピンと来ない人もいる。要するに与えられた規則に基づいて、数を足していくだけの話なのだけれども、慣れないとどういったものだか分かりづらいところがある。 総和記号の使用例 \[ \sum_{n=3}^{7} 2i = 2 \cdot 3 + 2 \cdot 4 + 2 \cdot 5 + 2 \cdot 6 + 2 \cdot 7 \] いずれにせよ、統計の教科書では、総和の記号がよく出てくるので、総和記号の取り扱いに把握しておくと統計が理解しやすくなる。高校の教科書だと、普通、数列について扱っている章に載っている。 組み合わせ論と確率 組み合わせ論と確率については、統計の入門書にもしっかり載っているので、特に力を入れる必要はないと思う。「そう言えばこんな感じなのだな」と、軽く確認するだけで十分だ。 対数 言語現象は対数の形で表されることが多いので、しっかり把握しておくこ

  • 統計局ホームページ/50音順一覧

    か行   さ行   た行   な行   ら行 か行 科学技術研究調査 科学技術研究調査は、我が国の企業、非営利団体・公的機関及び大学等について、研究費、研究関係従業者など、毎年の研究活動の実態を把握することにより、科学技術振興に必要な基礎資料となる結果を提供する調査です。 家計消費状況調査 家計消費状況調査は、世帯を対象として、購入頻度が少ない高額商品・サービスの消費やIT関連消費の実態を毎月調査しています。調査結果は、個人消費動向の分析のための基礎資料として利用されるとともに、我が国の景気動向を把握するための基礎資料としても利用されています。 家計調査 家計調査は、世帯を対象として、家計の収入・支出、貯蓄・負債などを毎月調査しています。調査結果は、我が国の景気動向の把握、生活保護基準の検討、消費者物価指数の品目選定及びウエイト作成などの基礎資料として利用されているほか、地方公共団体、民間

  • 統計局ホームページ/統計データ

    分野別一覧 国勢調査,経済センサス,人口推計,労働力調査,家計調査,消費者物価指数など統計局が実施している統計調査・加工統計及び日統計年鑑,日の統計,世界の統計などの総合統計書の分野別一覧を表示 50音順一覧 統計局が実施している統計調査・加工統計及び総合統計書の50音順一覧を表示 公表スケジュール 統計局が実施している統計調査などの結果の公表スケジュールを紹介 統計トピックス 統計局が実施している統計調査などを社会情勢(国民の祝日、記念日等を含む)を踏まえたテーマに分析・編集して紹介 統計表一覧(Excel集) 統計局が実施している統計調査などの統計表をダウンロードできるコーナー 総合統計書 結果の利用案内 統計局が実施している統計調査などの結果の入手方法を紹介(統計相談室,各調査担当課,統計図書館,刊行物・電磁記録媒体の販売先など) 政府統計公表・提供状況(府省別)(政府統計の総合

  • 事後確率と尤度(頻度主義とベイズ主義について)

    ---------------------------------------------------------- 事後確率と尤度――系統推定における最尤法とベイズ法の最前線 ---------------------------------------------------------- 尤度(likelihood)とはある仮説(モデル)のもとで観察されたデータが生じる確率を意味しています.以下では,この尤度が「ベイズの定理」と呼ばれているもののパーツを構成していることを示します.これは,系統推定の業界で「最尤法」に代わるものとして最近用いられ始めている「ベイズ法」を理解する要になります. ------------------------ ●「ベイズの定理」の導出 ------------------------ いま,観察データDが与えられたとして,それを説明する対立仮説がHi(i

  • 層化抽出法 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "層化抽出法" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2023年12月) 層化抽出法(そうかちゅうしゅつほう、英: stratified sampling)とは、統計学における母集団からの標調査の手法のひとつ。 概要[編集] 部分母集団が互いに大きく異なるとき、各部分母集団(層)毎にサンプルを抽出することに意味がある。層化(Stratification)とは、母集団を相対的に同質なグループに分けるプロセスであり、サンプリングの前に行われる。層は相互排他的である。すなわち母集団の要素はいずれか1つの層にのみ属する。層は集合的網羅的で

  • 標本はいくつ集めたらよいか 兵庫教育大学 成田 滋

    Updated December 25, 2001 [心理・教育のための統計の初歩][論文の書き方] [偏相関分析について][多変量解析は強力で難しくない] [ノンパラメトリック法による分散分析の方法 --Friedman][直線的関連 Correlation][データの変換/変数の変更] [データの性質と反復測定データ: Repeated Mesurement][ 共分散分析について][データの性質を知ろう][クラスター分析: Cluster Analysis][判別分析: Discriminant Analysis][重回帰分析: Multiple Regression Analysis][因子分析: Factor Analysis][データの標準化] サンプルサイズ いろいろな調査をする場合、どの位の標数(サンプル数)を集めたらよいかが問題となる。標とは、ある一定の

  • 日本標準産業分類とは

    標準産業分類とは (平成19年11月 第12回改訂) 日標準産業分類は,統計調査の結果を産業別に表示する場合の統計基準として,事業所において社会的な分業として行われる財貨及びサービスの生産又は提供に係るすべての経済活動を分類するものであり,統計の正確性と客観性を保持し,統計の相互比較性と利用の向上を図ることを目的として,昭和24年10月に設定されている。その具体的な内容は,事業所において行われる農業,建設業,製造業,卸売業,小売業,金融業,医療,福祉,教育,公務などすべての経済活動を,大分類,中分類,小分類及び細分類の4段階に分類したものである。 分類は,「統計調査に用いる産業分類並びに疾病,傷害及び死因分類を定める政令(昭和26年政令第127号)」第2条第3項の規定に基づき,総務大臣が統計審議会の意見を聴いて定めるものであり,同条第1項の規定に基づき,指定統計調査及び国,日

    hayato34
    hayato34 2010/07/28
    事業所において社会的な分業として行われる財貨及びサービスの生産又は提供に係るすべての経済活動を分類するもの
  • 多次元尺度構成法 - Wikipedia

    多次元尺度構成法(たじげんしゃくどこうせいほう、MDS:Multi Dimensional Scaling)は多変量解析の一手法である。主成分分析の様に分類対象物の関係を低次元空間における点の布置で表現する手法である(似たものは近くに、異なったものは遠くに配置する)。古典的MDSは主座標分析 (Principal Coordinate Analysis; PCoA) とも呼ばれ、さらに主座標分析において距離にユークリッド距離を用いた場合は主成分分析と等価になる。 例 - 1973年のアメリカ50州の人口10万人あたりの殺人、暴行、レイプの犯罪数、及び、都市人口の割合[%]の4つの要素から似た州は近くに置くように2次元空間に配置した結果。

    多次元尺度構成法 - Wikipedia
  • 1