タグ

2013年9月15日のブックマーク (3件)

  • データサイエンティストではない人に知っておいて欲しい事 - hotokuとは

    統計を専門にしている訳ではない人と話していて感じた違和感があったので、書き留めておきたい。 疑うべき順番は モデル → 推定法 データ分析をしていれば、当然、期待を掛けたモデルのデータへの当てはまりそうが悪いという事が度々ある。こういう時、統計屋さんとして自然に浮かぶのは「モデルが間違っている」という発想である。と思うのだが、非統計屋さんと話していると、このような時に「別の推定法を試してみたらどうだろう」と言われる事がある。多分、目の前のモデルに対する過度の期待から来るのだろうと思うが、このような態度では統計的に見ると妥当性を欠いた分析をしてしまう危険を孕んでいる。 ひとつの事例 とある線型状態空間モデルのパラメータを推定した所、どうしてもデータに合わない部分があった。実は、それが合わない理由は簡単で、ある潜在変数は常に正であるはずなのだ。線型状態空間モデルでは、潜在変数の分布は正規分布で

    データサイエンティストではない人に知っておいて欲しい事 - hotokuとは
  • データサイエンスのお奨め教科書。統計屋さん的視点から - hotokuとは

    知人に、確率・統計を勉強するにはどんなん読んだら良いんかね?と聞かれたので、まとめる。 線形代数 統計を勉強しようと思ったら、先ず、線形代数を勉強するのが良いと思う。回帰分析とか主成分分析とか多次元尺度構成法とか、こういう有名ドコロが一発で分かる。線形代数を知らずに統計ので「コレコレの計算で出てきた値が第一主成分だよ」みたいな説明を何回くり返し読んでも、多分、一生理解出来無いと思う。対称行列は直交行列で対角化出来るよね、とか、これは射影行列の形だね、とかが自然に分かるようになってから、統計のを読むとよく理解出来る。 で、線形代数のお奨めはこれ。 プログラミングのための線形代数 作者: 平岡和幸,堀玄出版社/メーカー: オーム社発売日: 2004/10/01メディア: 単行購入: 27人 クリック: 278回この商品を含むブログ (90件) を見るプログラミングのための…とあるんだけど

    データサイエンスのお奨め教科書。統計屋さん的視点から - hotokuとは
  • 震災から2年 風評と戦う - 放送内容 - NHK総合

    安全な農産物を届けたい 風評との戦いは続く 安全な農産物 どう確保?厳しい基準でも続く風評 国は去年の4月から、一般品については含まれる放射性セシウムを1キログラム当たり100ベクレルとしています。アメリカやEUの基準と比べると10分の1以下。これは国際的な委員会がこれ以上の措置を執る必要はないとしている指標に基づく水準です。基準値を超える品が見つかった場合には、その地域で出荷制限を行って、流通を止めます。しかし今、基準を超えた農産物は出回っていないのにもかかわらず、被災地の農産物、風評被害が続いているという状況...。そこで福島県ではこの2年間、農産物の安全性を確保しようと、独自に実態調査を行って風評を克服しようとしてきました。 作付け制限で農業離れの危機        「もうあきらめよう」の声も 福島市渡利地区のコメ農家、斎藤雅(ただし)さんです。斎藤さんの地区では、山あいに広が