タグ

statisticsに関するYasSoのブックマーク (45)

  • データサイエンティストもしくは機械学習エンジニアになるためのスキル要件とは(2017年夏版) - 渋谷駅前で働くデータサイエンティストのブログ

    この記事は2年前の以下の記事のアップデートです。 前回はとりあえずデータサイエンティストというかデータ分析職一般としてのスキル要件として、「みどりぼん程度の統計学の知識」「はじパタ程度の機械学習の知識」「RかPythonでコードが組める」「SQLが書ける」という4点を挙げたのでした。 で、2年経ったらいよいよ統計分析メインのデータサイエンティスト(物:及びその他の統計分析職)vs. 機械学習システム実装メインの機械学習エンジニアというキャリアの分岐が如実になってきた上に、各方面で技術革新・普及が進んで来たので、上記の過去記事のスキル要件のままでは対応できない状況になってきたように見受けられます。 そこで、今回の記事では「データサイエンティスト」*1「機械学習エンジニア」のそれぞれについて、現段階で僕が個人的に考える「最低限のスキル要件」をさっくり書いてみようかと思います。最初にそれらを書

    データサイエンティストもしくは機械学習エンジニアになるためのスキル要件とは(2017年夏版) - 渋谷駅前で働くデータサイエンティストのブログ
  • データサイエンス・オンライン講座「誰でも使える統計オープンデータ」

    第1週:e-Statの統計データを活用した データ分析の事例、基的な活用方法を学ぶ ・統計を仕事に活かすとはどういうことか ・e-Statを使った現状把握 ・複数の統計を組み合わせた指標の計算 ・e-Statを使った関連要因の探索 ・e-Statを使った将来の予測 ・e-Statによるデータの探し方 ・e-Stat上でグラフを描こう 第2週:国の経済の規模をはかるGDP統計と 関連する統計の見方を学ぶ ・景気判断に求められる統計 ・GDP統計~GDPとは ・GDP統計の読み方 ・GDP統計からみた基礎統計・関連資料 ・GDPの名目と実質 第3週:人口統計・労働関連統計を中心に景気判断に 用いられる統計の見方を学ぶ ・長期の経済成長と人口統計 ・公的統計の活用① 人口統計 ・労働市場の分析:雇用と賃金 ・公的統計の活用② 雇用・賃金統計 ・その他の公的統計:事業所・企業 第4週:統計データ

    データサイエンス・オンライン講座「誰でも使える統計オープンデータ」
  • 社会人のためのデータサイエンス入門/総務省統計局データサイエンス・オンライン講座

    第1週:統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 第2週:データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標分布 ・信頼区間 第3週:データの見方と適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 第4週:誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公

    社会人のためのデータサイエンス入門/総務省統計局データサイエンス・オンライン講座
  • かわいい制服天国 | かわいい制服天国は、全国の学校の可愛い制服をあつめたサイトです。

    低身長に巨乳! 稀に見る素晴らしいキャラ!!『ヘスティア』 黒髪のツインテールがポイント!露出が高いコスチュームも可愛い!! ~Anime Account~さん(@val.agueria)が投稿した写 …

    かわいい制服天国 | かわいい制服天国は、全国の学校の可愛い制服をあつめたサイトです。
    YasSo
    YasSo 2013/07/04
    Webアンケート調査ってそれに関心の高い人しか回答してなさそう。だからすごく偏った結果になってるはずだよね。うまくサンプリングするには実施方法を工夫しないとダメだろうな…。
  • 政府統計データ、API提供開始 実際に取得し可視化してみた:オープンデータ情報ポータル

    2013/06/21 データジャーナリズム 総務省では、6月10日から統計データのAPI(Application Programming Interface)提供を開始した。インターネットを通じて機械的にデータを取得し、自社の持つシステムやウェブサイトで活用することができる。 独立行政法人統計センターが運用している「次世代統計利用システム」で試験的に行っているもので、登録すれば誰でも利用できる。現在APIで提供されているのは、国勢調査、住宅・土地統計調査、地域メッシュ統計、消費者物価指数など総務省統計局所管の統計で、データ量は表にして約32,000、約47億セルに及ぶ。 政府から最新データが提供されると、利用者側のウェブサイトでも自動的に同期して更新するようにしたり、政府データとその他のデータをシステム上で組み合わせて分析する、といった利用を想定している。 総務省ではこの試験運用でノウハウ

  • 無料で利用できるデータベース&レファレンスサービスまとめ

  • 月水金フラッシュニュース・データから読む|「見せる防犯」で犯罪は減少したか|セキュリティ(防犯・警備)のセコム

    警察庁のまとめによると、2011年末時点での防犯ボランティア団体は、全国で4万5672団体あるとのことです。警察庁が自主防犯ボランティア活動支援サイトを開設した2005年と比べると、2.3倍にまで増えています。 また、犯罪を抑制したり、検挙に貢献したりといった事例も増えており、防犯ボランティアは地域の「安全・安心」のために欠かせない存在になっています。 犯罪の減少と防犯ボランティア増加の関係 前出の警察庁の資料によると、2003年の時点で防犯ボランティアは3056団体でした。年々、団体数は増加し、昨年の時点で4万5000団体を超すまでになりました。それとは反対に、年々減少してきたのが犯罪件数です。2002年に285万件とピークを迎えた刑法犯は2003年から減少を続け、昨年は148万件となりました。 2つのデータの関係性を示す相関係数というものがありますが、ボランティア団体数と刑法犯罪数の数

    月水金フラッシュニュース・データから読む|「見せる防犯」で犯罪は減少したか|セキュリティ(防犯・警備)のセコム
  • RjpWiki - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですRjpWiki はオープンソースの統計解析システム 《R》 に関する情報交換を目的とした Wiki です † どなたでも自由にページを追加・編集できます. (初めて投稿・既存記事への追加・修正を行なう方はこのページ末の注意*1を御覧下さい) ページへのファイル添付については、画像ファイルのみパスワードなしで可能としてあります(ページ上部「画像添付」より)。その他のファイルの添付はパスワードを入力することで可能です(ページ上部「ファイル添付」より)。現在のパスワードは, Rでの round(qt(0.2,df=8),3) の実行結果です。 スパム書き込みに対処するため、書き込み系の処理に対してパスワードを設けました。ユーザ名の欄には,Rで round(qt(0.2,df=8),3) を実行

  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • タコでもわかる主成分分析

    <BODY> <P>このページを表示するには、フレームをサポートしているブラウザが必要です。</P> <P>「主成分分析とは?」の初心者から、学会発表までの実務的内容を例をあげて説明しています。 <P><A HREF="tako01.html" TARGET="_blank">こちら</A>でみてね。</P> </BODY>

  • 生活や実務に役立つ高精度計算サイト

    2025/7/29 広告表示についてのご案内 いつも「keisan.site」をご利用いただき、誠にありがとうございます。 このたび、サイトに Google AdSenseによる広告表示 を導入いたしました。 これは、サイトの維持・運営にかかるサーバー費用や人件費などのコストを補うための取り組みです。 現在は自動広告による掲載を行っており、一部のページでユーザビリティが損なわれていると感じられる場面もあるかもしれません。 この点については真摯に受け止めており、今後は広告の表示位置やタイミングを調整し、できる限り快適なご利用環境を損なわないよう改善を進めてまいります。 「keisan.site」は、誰でも無料で計算ツールを使える場として、今後も多くの方に便利にお使いいただけるよう努めてまいります。 運営継続のための広告導入について、何卒ご理解を賜りますようお願い申し上げます。 2025/7

    YasSo
    YasSo 2012/01/12
    計算式を共有するサイト。ブラウザ上で実際に計算したりグラフを描画したりもできて便利そう。
  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • 福島原発事故後の米国北西部の乳幼児死亡数

    以下は 原発事故以降アメリカ北西部で乳幼児の死亡数が35%上昇しているって、ホント? - warblerの日記 に触発されて書いたものです。先日福島で開かれた国際会議「放射線と健康リスク」でもとりあげられたそうです(Thanks: 片瀬久美子さん)。 まずは次の記事。 Janette D. Sherman and Joseph Mangano, Is the Increase in Baby Deaths in the US a Result of Fukushima Fallout? そこに示されたデータ: 2011/3/19までの4週 12.5/9.25≒1.35 で,35%の増加です。これは統計的に有意です,とShermanたちは書いています。 当でしょうか。全部で162人で,そのうち4/14が最初の4週に入るという帰無仮説を立てます。実際に最初の4週に入ったのは37人ですから,R

  • 原発事故以降アメリカ北西部で乳幼児の死亡数が35%上昇しているって、ホント? - warbler’s diary

    原発事故以降アメリカ北西部で乳幼児の死亡数が35%も急上昇しているという驚くべき統計結果が報告されていました。この報告をしたのは、医師のJanette Shermanさんと疫学者のJoseph Manganoさんです。 ・Is the Dramatic Increase in Baby Deaths in the US a Result of Fukushima Fallout? 米国における赤ちゃんの死亡が劇的に増加しているのは、福島第一原発の放射性降下物のせいなのか? <2011.6.10〜12> http://www.counterpunch.org/sherman06102011.html The recent CDC Morbidity and Mortality Weekly Report indicates that eight cities in the northwest

    原発事故以降アメリカ北西部で乳幼児の死亡数が35%上昇しているって、ホント? - warbler’s diary
  • 続・妄想的日常 ナイチンゲールと統計学

    317 名前:名無しさん@十一周年 投稿日:2011/02/04(金) 01:05:29 Affax6GbP >>310 統計学は元々、元祖看護婦である、ナイチンゲールが始めたんだが 結果の余りの「悲惨さ」に、彼女自身一ヶ月余り 心神喪失状態になった、とも言われている。 事の発端は、とある将軍が、 「戦場よりもナイチンゲールの戦傷者看護の方が兵士が死亡してる」 と揶揄したことに始まる。 当然、ナイチンゲールは反発。件の将軍に反論する為、統計学を編み出し 自分の看護の方が、多くの兵士を救ってると自ら証明しようとした。 しかし、結果は将軍の言うとおり、病院での看護の方が戦場よりも 傷病兵の致死率が極めて高いことが明らかになってしまう。 ナイチンゲールはショックの余り心神喪失状態になった・・・ でもそこから始まるンだよね、彼女が偉大である話は 何が間違っていたか、模索し始めるんだ、諦める事無く

  • 日本人のお金の使い方がまるわかりになる全国消費者実態調査データ | 初代編集長ブログ―安田英久

    今日は、世の中の人がどんなお金の使い方をしているのかを全国で調査したデータを紹介します。市場調査を行うにあたって参考になるかなり詳細なデータを入手できます。しかも無料で。 「30代の男性は書籍や雑誌に1か月あたり何円使っているのか」「ケータイの通信費は、年齢層でどれくらい違うのか」「緑茶と紅茶とコーヒーと、それぞれいくらぐらい使っているのか」「やシャツや下着に使っているお金は?」「CD・DVDやゲームにはどれくらいお金を使っているのか」「映画や遊園地や温泉にはみんなどれくらい行っているのか」こんなデータがあればいいと思いませんか? それがあるのです。 そのデータとは、総務省統計局が行っている「全国消費実態調査」。 平成21年全国消費実態調査(統計局)全国消費実態調査とは、国民生活の実態について、家計の収支や貯蓄・負債、耐久消費財、住宅・宅地などの家計資産を総合的に調査し、世帯の消費・所得

    日本人のお金の使い方がまるわかりになる全国消費者実態調査データ | 初代編集長ブログ―安田英久
  • PENの中の人 - 捏造グラフ推奨

    このトラックバックURLを使ってこの記事にトラックバックを送ることができます。 もしあなたのブログがトラックバック送信に対応していない場合にはこちらのフォームからトラックバックを送信することができます。.

  • 第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT

    今ほど統計解析が必要とされる時代はありません。オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しましょう! 読者にとってRは、世に溢れるデータの密林を切り開くための“ブッシュナイフ”となることでしょう(編集部) 統計解析の必要性とリテラシー 21世紀になって、経営学者の故ピーター・ドラッカー氏が言うところの知識労働者は、ますます統計解析を必要する局面が増えてきました。この状況は、20世紀後半から21世紀に起きた計算機能力の増大とインターネットの発展を基礎に、3つの大きな潮流が現れたことがキッカケとなっているように思います。その3つの潮流とは、オープンソース、オープンデータ、そしてオープンアイデアです。後ろの2つは今筆者が名付けました。 オープンソースは、皆さんがご存知のように、Linux、Apache、PerlPythonRubyなどのO

    第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT
  • グラフの読み方使い方 ~ 「一つのグラフには一つの主張」の罠(第1回) | データをざくざく処理するためのグラフの読み方、使い方

    このグラフの何がいけなかったのか?次のグラフは、あるコンペの企画書の中で使われたグラフです。プレゼン担当者はこのグラフで、「自宅からのインターネットの利用率は、平日より週末の方が高い」という一つの主張を説明したかっただけなのですが、相手が悪かったようで、このグラフに関して、いろいろと突っ込まれてしまいました。そしてその答えが要領を得なかったために、結局プレゼンでは来の主張を述べる時間もなく終わってしまいました。 さて、もしあなたがプレゼン先の相手だとしたら、このグラフのどこに突っ込みを入れますか? A たまたま2007年だけだったのではないのか? 毎年同じ傾向になっているのか? B 「通常の8週間」というのは何か。このパターンに合致した週を恣意的に選んだのではないのか? C 縦軸の目盛りが40%から始まっているから差があるように見えるだけで、そもそも53%と57%では、それほど差があると

    グラフの読み方使い方 ~ 「一つのグラフには一つの主張」の罠(第1回) | データをざくざく処理するためのグラフの読み方、使い方
    YasSo
    YasSo 2010/07/21
    テキスト作ろうと思ってたけど、ちょうど良いページがあった。
  • How to 統計 - 高校生用学習サイト - 総務省統計局

    YasSo
    YasSo 2010/06/22
    授業で使いたいけど、高校生用って書いてるから大学の授業で使いづらいやん。