タグ

統計に関するahahasasaのブックマーク (81)

  • データサイエンスのお奨め教科書。統計屋さん的視点から - hotokuとは

    知人に、確率・統計を勉強するにはどんなん読んだら良いんかね?と聞かれたので、まとめる。 線形代数 統計を勉強しようと思ったら、先ず、線形代数を勉強するのが良いと思う。回帰分析とか主成分分析とか多次元尺度構成法とか、こういう有名ドコロが一発で分かる。線形代数を知らずに統計ので「コレコレの計算で出てきた値が第一主成分だよ」みたいな説明を何回くり返し読んでも、多分、一生理解出来無いと思う。対称行列は直交行列で対角化出来るよね、とか、これは射影行列の形だね、とかが自然に分かるようになってから、統計のを読むとよく理解出来る。 で、線形代数のお奨めはこれ。 プログラミングのための線形代数 作者: 平岡和幸,堀玄出版社/メーカー: オーム社発売日: 2004/10/01メディア: 単行購入: 27人 クリック: 278回この商品を含むブログ (90件) を見るプログラミングのための…とあるんだけど

    データサイエンスのお奨め教科書。統計屋さん的視点から - hotokuとは
  • Be the Change : 「データジャーナリズム実践:Googleを使って社会を読み解く」に参加してきました

    昨日、日ジャーナリスト教育センター主催のワークショップに参加してきました。 テーマは「データジャーナリズム実践:Googleを使って社会を読み解く」。講師は「次世代マーケティングリサーチ」の著者であるマーケティングリサーチャーの萩原雅之さんでした。イベント詳細はこちら。 前半は萩原さんからマーケティングリサーチについてのお話(前回のイベントでのお話のダイジェスト)、後半は実際に手を動かしてみようということで「Google insights for search」と「Google Public Data Explore」を参加者各自のPCで使ってみました。 このGoogleが提供している2つのサイト、存在は知っている方が多いかもしれませんが実際に活用している方は少ないのではないでしょうか。私もそうだったのですが、使ってみるととても面白かったです! 以下、少し解説してみます。 ■Google

  • 放送大学 - REDIRECT

    当サイトは移転しました。10秒後に以下のURLにリダイレクトします。 自動でリダイレクトされない場合、以下のリンクから移動してください。 https://info.ouj.ac.jp/~suuri/_webTohkei/ キャンパスネットワークホームページは教務情報システム(システムWAKABA)に統合されました。 上記に伴い「www.campus.ouj.ac.jp」ドメイン上の各サイトは「info.ouj.ac.jp」に移行されました。 2019 The Open University of Japan

    ahahasasa
    ahahasasa 2012/02/09
    地味にすごい
  • 2NT -無料ブログ 無料ホームページ 等-

    2NTは無料ブログ、無料ホームページ等、楽しいWEB Lifeをお届けするポータルサイトです。

    ahahasasa
    ahahasasa 2010/10/22
    2chにもいるんだ。やっぱり給料すごい。/高安先生の本おもしろいよ。http://amzn.to/d2pMjw
  • みずほ総合研究所

    みずほ総合研究所株式会社は2021年4月にみずほ情報総研株式会社と統合いたしました。 このサイトは自動的に移動します。 移動する

  • Twitterや飛行経路がアートに:データを視覚化する作品4選 | WIRED VISION

    前の記事 太陽系最大の嵐:木星の大赤斑、熱分布が判明 Twitterや飛行経路がアートに:データを視覚化する作品4選 2010年3月19日 デザイン コメント: トラックバック (0) フィードデザイン Hugh Hart ロンドンのビクトリア&アルバート博物館で4月11日まで開催されている展覧会『Decode: Digital Design Sensations 』は、生データを「バーチャルな絵の具」にして、情報の流れを視覚化する作品がテーマだ。 キュレーターのひとりShane R.J. Walter氏は、「Decodeのアーティストたちは、彫刻家が粘土を使うように、コードを素材として使う」と説明する。彼らの作品から、いくつかを紹介しよう。 加速し衝突するTwitterの粒子 Social Collider(ソーシャル・コライダー)は、『Twitter』のメッセージをユーザー名や話題で追

  • 統計のスペシャリストが伝授、データを活用するときの5つの心得 | ライフハッカー・ジャパン

    学者ならずとも、データを使って考察したり、仮説を検証する機会はあるもの。コンピュータ技術の発達により、面倒なデータ集計や難しい計算は、すべてコンピュータにお任せできるわけですが、「その結果から、何を読み解き、どう考えるか?」はヒトが担うべき重要な役割ですね。こちらでは、統計のスペシャリスト直伝のデータ活用術をご紹介しましょう。 統計学の博士課程に在学しているNathan Yauさんは、数々のデータ分析の経験から、データを活用するコツとして、以下のようにまとめています。 細部に注目する データ分析では傾向やパターンにばかり目がいきがちだが、同様に「異常値」にも注目することが大切。見逃している視点がここに潜んでいることも。 大局で捉える データひとつひとつを別々に捉えるのではなく、データひと塊をザクっと捉えて、大きく考えることを心がけよう。 予断を持たない データ分析は可能な限り客観的に行うべ

    統計のスペシャリストが伝授、データを活用するときの5つの心得 | ライフハッカー・ジャパン
  • 「どうせ産めないから…」未婚族の本音?:日経ビジネスオンライン

    宇南山 卓(うなやま・たかし)氏 1997年東京大学経済学部卒、99年同大学大学院修士課程修了、2004年同大学博士(経済学)。慶應義塾大学、京都大学講師を経て現職。専門は、日経済論。現在、日経済研究センター特別研究員・経済産業研究所ファカルティーフェローとして、少子化と女性労働について研究している。日経済研究センターでは「若手研究者による政策提言プロジェクト」に参加、経済産業研究所では吉川洋東京大学教授の研究プロジェクト「少子高齢化と日経済」のサブリーダー。(撮影:福島正造、以下同) ―― 少子化が深刻になり、国会では「子ども手当」など、子育て世代への支援策が議論されています。保育園の待機児童問題も注目を浴びています。 宇南山 私は、待機児童を政策目標とすることは間違っていると思います。 もちろん、待機児童をゼロにしようと東京都などは当にがんばっていますし、その方向性は正しいと

    「どうせ産めないから…」未婚族の本音?:日経ビジネスオンライン
    ahahasasa
    ahahasasa 2010/02/18
    コメント欄の女性は家庭、男は仕事的な思想に呆れた・・・・
  • 豊健活人生:春山昇華 : 名目GDP

    2010年02月15日08:43 カテゴリ株式(日海外)&商品・為替[edit] 名目GDP ようやく減少が止まった。 増える必要がある。 株価、不動産価格、賃金、、、、全て名目GDPの関数だ。 (完全輸出企業という例外はあろうが・・・) 下は世界との比較 世界と差がつくのも当然だ 「株式(日海外)&商品・為替」カテゴリの最新記事

  • ネット時代で「読む量」が急増:研究結果 | WIRED VISION

    前の記事 iPadはマンガ界をどう変える? 『Panelfly』がiPad対応に 「光合成は量子コンピューティング」:複数箇所に同時存在 次の記事 ネット時代で「読む量」が急増:研究結果 2010年2月10日 Eliot Van Buskirk 1960年から2008年の変化。コンピューター(緑色)が始まった結果、印刷物(黄色)は減ったが、テレビ(青色)も減っている。拡大図。Image courtesy of the University of California at San Diego's Global Information Industry Center 一般的な意見では、YouTubeやビデオゲーム、ケーブルテレビ、iPodといったもので書き言葉の利用が減って来ていると見られている。視覚を中心とした娯楽が増えた結果、紙媒体や長文のコンテンツは減り、バイトサイズのデジタル・コンテ

  • クライメートゲート:あなたは何を信じる事を選ぶのか? - P.E.S.

    池田先生がまたなんか小躍りしてられますなぁ、と思っていたらコロンビア大学の統計と政治学教授アンドリュー・ゲルマンのブログで物理学者のPhilという方(プロフがなくて、詳しい事はわかりません)がクライメートゲートへの感想を書いてられました。タイミングも良かったし、書いていることも同意できるので訳してみました。で、気候変動についての文章を訳してはいるんですが、人為的気候変動の問題について深い興味があると言うわけではありません。それ関係の学界が人為的気候変動が起こっているということでまとまっているのなら、専門家ではない人間としてはそう考えるのが妥当なんだろう、というぐらいです。実はこの問題についての個人的な興味は、その気候変動の問題そのものよりも、専門家でもないのに学界での主流派は間違っている、間違っているはずだ、と断言できる人たちの方に興味があります。なぜ彼らはそう信じるのか?それ関係について

    クライメートゲート:あなたは何を信じる事を選ぶのか? - P.E.S.
    ahahasasa
    ahahasasa 2010/02/09
    気候変動の問題は経済的な問題を内包しているからたちが悪いということ
  • 統計学的「片手の法則」でサービス業の生産性をもっと上げよう:日経ビジネスオンライン

    前回は、自分達の職場にある様々な問題を、データを集め、記録を取ることによって、顕在化する事をお勧めした。現状がどうなっているのかを認識して初めて、改善する事ができ、その結果、ボーナス年3回も可能になるのである。 今回はさらに、二、三の表やグラフを用いて、それらが業務改善に実際に簡単に使えることを例示したい。 度数分布表とヒストグラム 例1 得られたデータを整理する時、よく使われる表に表1のような度数分布表がある。 度数分布表というのは、データが一定の尺度によって測られた時に、そのデータを集計するための表である。例えば、ある学校の6年生の学童の背の高さを図った記録とか、ある地域の住民の所得の分布だとかを、集計する時に用いられる。統計で用いられる多くの分布の元は、表1のような度数分布表からできている。 表1は、ある工場で仕入れ先から仕入れている部品の軸の長さの分布である。この表があると、平均が

    統計学的「片手の法則」でサービス業の生産性をもっと上げよう:日経ビジネスオンライン
    ahahasasa
    ahahasasa 2010/02/09
    戦略とは物事の重要性に基づいて優先順位を付ける事である。その時、上位5つの項目についてだけ集中して、解決を図るべきである。5つ以上の事は忘れなさい。
  • 若者は“テレビ離れ”していない--M1・F1総研の調査で明らかに

    若者は“テレビ離れ”していない、むしろ多様な視聴スタイルによって受け入れられている。こんな実態が、若者層のマーケティング調査機関であるM1・F1総研の調べでわかった。 同社は1月28日、首都圏在住の20歳〜34歳男女テレビ視聴動向に関する調査レポート「若者におけるテレビの存在価値の考察」(PDF)を発表した。 それによると、M1層(男性20歳〜34歳)、F1層(女性20歳〜34歳)は、M2(男性35〜49歳)、F2(女性35〜49歳)と比べてもテレビを平日、休日ともによく見ており、自宅で1番長い時間していることでも「インターネットをする」を上回り「テレビ番組を見る」がトップ。テレビ好きが多く、CMを見ない人は圧倒的に少数派であることがわかったという。 1日あたりの平均テレビ視聴時間は、平日はM1層が2時間25分、F1層が3時間4分。休日になるとそれぞれ、3時間36分、3時間49分に増加す

    若者は“テレビ離れ”していない--M1・F1総研の調査で明らかに
    ahahasasa
    ahahasasa 2010/01/29
    しっかり見るのところがおかしいw 回答がおかしいよw
  • クリーニングに出されるUSBメモリは年間4500個 | WIRED VISION

    前の記事 『キーボードのガレージ』、商品開発ソーシャルサイトで開発 「Appleタブレット」1983年のプロトタイプ 次の記事 クリーニングに出されるUSBメモリは年間4500個 2010年1月25日 Charlie Sorrel Photo: Charlie Sorrel/Wired.com 英国では昨年、ポケットに忘れられたままドライクリーニングに出されたUSBメモリが4500個にのぼったという。これはよくあることだ。筆者は、『iPod Nano』を洗濯機にかけた経験すらある――幸い、慎重に手当したところ、無事に生き返った(日語版記事)のだが。 この調査結果は、データセキュリティCredant Technologies社によるもので、USBメモリに重要な企業データを保存することの危険性を主張する意図があるようだ。 同社の主張によると、洗濯が必要なうっかり者の従業員を抱える企業は、英

  • 外部要因を意識したデータの読み解き方――調査・リサーチ・統計の基礎その6 | リサーチ/データのリテラシー入門——調査統計の基礎知識

    実はこの会社が取り扱っているのは成熟商品で、技術革新もなく、新たな市場を創造していくようなマーケットではありません。そのため市場規模は橙色線のように下降基調でした。 しかしながら無理な予算を作り、現場は不正ぎりぎりの行為を行っていたうえに、社長の裏金を使った不正も発覚し、社長解任となりました(架空の話です)。不審に思った株主が追及したことがきっかけでした。市場の状況が読めない社長は、不正をするまでもなく、早期退任となったでしょう。 相対的に見るために市場全体の動きと比較する数字は客観的で絶対的なものと思いがちですが、こうした1つの決まった数字やデータですら、実際は主観的で相対的なものです。というお話をプロローグでもお話ししましたが、「相対的に見る」ための代表として、市場全体がどう動いているかが大事です。 そんなこと当たり前だと思うかもしれませんが、意外と後から言われて気がつくことも多いはず

    外部要因を意識したデータの読み解き方――調査・リサーチ・統計の基礎その6 | リサーチ/データのリテラシー入門——調査統計の基礎知識
    ahahasasa
    ahahasasa 2009/12/31
    一部の範囲だけをグラフ化して、変化を大きく見せるトリック 2次元、3次元のイメージを利用して、変化を大きく見せるトリック
  • 調査方法に潜む罠とチェックの重要性――調査・リサーチ・統計の基礎その4 | Web担当者Forum

    前回までは、調査対象者のサンプリングや回収率による偏り、標誤差といった話をしてきました。今回は「調査方法や内容に潜む罠」と「チェックの重要性」に関してお話しします。 同じ内容の調査をするにも、さまざまな実施方法があります。費用や日程などとの兼ね合いで最良の方法を選択するのですが、定量的な調査では、対面調査(訪問面接調査、電話調査など)と非対面調査(郵送調査、インターネット調査など)、機械式調査(インターネット視聴率調査、テレビ視聴率調査)があります。 調査方法の種類と考えられる落とし穴対面調査には「メイキング」の可能性があるここで言う対面調査とは、調査対象者と調査員が直接話をして、調査員がアンケート用紙に回答を書き込む方式を指すことにします。上で挙げた方法の中では、訪問面接調査と電話調査が該当します。 訪問面接調査では、調査協力者のお宅に伺って、調査協力者に質問をしながら回答を引き出しま

    調査方法に潜む罠とチェックの重要性――調査・リサーチ・統計の基礎その4 | Web担当者Forum
    ahahasasa
    ahahasasa 2009/12/31
    集まったデータをチェックする
  • アンケートは「回収率」が重要! 信頼性が有効回答数よりも高くなる理由 | リサーチ/データのリテラシー入門——調査統計の基礎知識

    母数の少ない統計でも、アンケートに答えた人の割合(回答比率・回答率)の高さが、信頼性につながる理由を解説します。回収率が低いと、調査結果に偏りが生じてしまい、真実と大幅にずれてしまう問題が起こります。そうした偏りを少なくするために、必要なサンプル数をはじきだす計算式と、サンプル数と回答比率と誤差の早見表を紹介します。 回答「数」が多い調査と、回収「率」が高い調査、どちらが信頼できるか?前回、調査対象者を選ぶときにはランダム性が重要であるという話をしました。そうしないとサンプルが偏るためです。しかしサンプル自体が偏っていなくても、実際の回答者が偏っているとやはり使えない調査となってしまいます。 数字を絡めた具体例でお話します。次の2つの調査を比較してみましょう。 サンプル数10万人(無作為抽出)、回答数1万人の調査(回収率10%)サンプル数1000人(無作為抽出)、回答数900人の調査(回収

    アンケートは「回収率」が重要! 信頼性が有効回答数よりも高くなる理由 | リサーチ/データのリテラシー入門——調査統計の基礎知識
    ahahasasa
    ahahasasa 2009/12/31
    偏りを避け、無駄な調査をしないためには、調査の回収率(協力率)が高いことが重要
  • 適切な調査対象者の抽出(サンプリング)とは? ?調査・リサーチ・統計の基礎その2 | Web担当者Forum

    ある会社のウェブ事業部の話です。会社の業績が思わしくないため、最も評価の低い事業部を廃止することが決定しました。ウェブ事業部の評価は、運営しているウェブサイトのアクセス数で行われます。アクセス数の根拠としては、アレクサのデータが使われることになりました。もしあなたがウェブ事業部の責任者だとしたら、どういう行動に出ますか? ご存知ない方のために少し説明しますが、アレクサは、だれでも参加できるインターネット視聴率調査のようなものです。アレクサの調査に参加するためのツールバーが配布されていて、そのツールバーをインストールしたブラウザでアクセスしたウェブサイトのデータがアレクサのサーバーに自動的に送られます。そして全世界のアレクサツールバーから集められたデータが集計され、だれでもそれを閲覧できるといったサービスです。 つまりこのサービスは、無料でどのウェブサイトが人気なのだろうという疑問に答えてく

    適切な調査対象者の抽出(サンプリング)とは? ?調査・リサーチ・統計の基礎その2 | Web担当者Forum
    ahahasasa
    ahahasasa 2009/12/31
    alexaは適度に信頼しろ
  • Insight for WebAnalytics

    ウェブアナリスト 宏美のブログ。WebAnalyticsの3Cデータと関連情報を提供。一つはcompetitor、市場マクロデータや競合データ。一つはcompany、自社のアクセス解析データ。最後はcustomer、ユーザー行動データ。数値の一人歩きをさせたくないので、詳しくは原典と各調査方法を確認のこと。 続いて、仕事時代の最終ステージ。なおこの回顧録には自分以外に登場する人達がいるが、直接的な人物名の記載はない。但し一部所属や肩書などの記載から推測できる場合はあるが、自分との関係性の文脈で必要最小限にしか触れていない。 ・独立時代 さあ、いよいよ自分で会社を作って仕事だ。初めから誰かを雇う積りはなく、大きくする野望もなく、最後まで一人取締役のみという株式会社だった。初めからある程度の仕事は持っていて独立できたので、いろいろと試行錯誤する時間が持てたことも幸いし、幕を閉じる2023年まで

  • 社会人に必要なリサーチ/データリテラシー5原則——調査・リサーチ・統計の基礎その1 | Web担当者Forum

    リサーチ/データリテラシーはWeb担当者の必須スキルインターネットが生活や仕事に欠かせないものになってきた現在、私たちの周りには数字や調査データがあふれています。昔からあったテレビの視聴率や人口統計をはじめ、ネット利用人口や携帯利用者数、1日の平均ウェブサイト閲覧時間など、数え上げれば切りがありません。 でも世の中には、おかしいデータが山のようにあります。決算数字の粉飾もありますし、耐震強度の計算を偽装することもありました。自説を主張するために、ウソに限りなく近い数字を使うことは日常茶飯事です。 マスコミ、政府など信頼に足ると思われる情報ソースですらそうです。いや、むしろ彼らのほうが、自分の主張に近いデータを選択して使うことが多いかも知れません。お役所は自分の責任になるようなことにはしたくありませんし、マスコミは自分の主張に沿ったデータを集めてくるでしょう。 こうした環境のもと、Web担当

    社会人に必要なリサーチ/データリテラシー5原則——調査・リサーチ・統計の基礎その1 | Web担当者Forum