タグ

統計に関するDrunkarのブックマーク (85)

  • 勇気を出して初めてのデータ分析 - データサイエンティストを目指して(1) -: 知財ファイナンス・モデリング

    今日は社会人がデータ分析をどのように独学で身に着けていけばいいかということを考えます。 ビッグデータがバズワードとなって以来、花形の学問のひとつとなったのが「統計学」です。統計学が重要なのは今も昔も変わらないわけですが、かつてはデータの分析になんて興味がなかった会社や部門がデータ分析を業務に役立てようとした結果、需要が増しています。 さて、私は社会人になってから統計学の素晴らしさを体感して勉強を始めました。筑波大学のビジネススクール(GSSM)で椿広計先生という大家の講義を受けて開眼しました。そういう意味では実に幸運だったと思います。 スクールに通って統計学を身に着けるというのも一つの手なのでしょうが、万人がスクーリングできるわけではありません。独学で身に着けて行かないといけない人が大半ではないでしょうか。大丈夫です。独学でも統計学を使いこなせるようになります。「数学」なんて・・・。という

    勇気を出して初めてのデータ分析 - データサイエンティストを目指して(1) -: 知財ファイナンス・モデリング
  • 若き経済学者のアメリカ

    もちろん僕はそういうアツさが決してキライではない。だから確かに一読の価値はある内容だとは思う。ただ、「これからの10年で最もセクシーな職業」というハル・ヴァリアンの有名な台詞に言及してはいるものの、書の中身からは統計学のセクシーさが最後まで伝わって来なかったのが、個人的にはとても残念でならない。 以下の3冊と比肩するくらいの、セクシーでワイルドでエキサイティングな統計学書が登場したかと思ったのだが、果たしてそれは期待し過ぎだっただろうか。

  • 第5回Tokyo.SciPyが開催されました - 随所作主録

    Tokyo.SciPyの第5回が1/26(土)に38名の参加者を集めて開催されました。 Python用の数値計算ライブラリNumPyと科学計算フレームワークSciPyの公開勉強会、第5回 プログラム 発起人をしてるものの、今回は完全に神嶌先生(@shima__shima)に運営をお任せしてしまって自分は当日の手伝いしか出来なかったのですが、Tokyo.Rなど裏番組たくさんあったのに通常の人入りで一安心でした。会場をご提供いただいたサイバーエージェント様と当日お手伝いいただいた関係者の方に厚く御礼申し上げます。 以下それぞれの発表について。 計算ソフト PythonSf(小林憲次さん) SciPy、sympy、vpythonをベースにPythonでmatlab/mathematicaレベルのことができる環境を!!という非常に野心的な取り組みについてのお話でした。詳しくはご人のWebサイトに

  • pandas - Python Data Analysis Library

    pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now!

  • 白書・統計 | 中小企業庁

    中小企業に関する白書や統計情報の一覧です。中小企業の数や基データ、景気情報、製造業の生産指数、倒産状況、産業連関表など、中小企業に関する様々なデータを掲載しています。

  • 土居正明のホームページ

    私の参加している、生物統計関係の各種勉強会での配布資料をまとめたページです。 統計初学者の方から理解できるような内容を目指しています。 誤植・論理的間違い等はあることが十分想定されますので、ご了承のうえ自己学習用にご利用ください。 なお、「こういう資料を作って欲しい」「こういう講義をして欲しい」というご希望も募集中です。 下記アドレスまでお気軽にご連絡ください。 略歴 資料 研究など リンク お知らせ 更新履歴 (過去の履歴はこちらです) 2016/07/10:リンク のページを作りました。 ご意見・ご感想・間違いのご指摘などは、下記アドレスまでお願いします。 doi_masaaki [あっとまーく] yahoo.co.jp なお、メールをいただく際、件名が「はじめまして」などの場合、スパムメールと勘違いして 誤って捨ててしまう可能性があります。 スパムでないことがはっきり分かる件名でお願

  • 統計局ホームページ/統計データ

    分野別一覧 国勢調査,経済センサス,人口推計,労働力調査,家計調査,消費者物価指数など統計局が実施している統計調査・加工統計及び日統計年鑑,日の統計,世界の統計などの総合統計書の分野別一覧を表示 50音順一覧 統計局が実施している統計調査・加工統計及び総合統計書の50音順一覧を表示 公表スケジュール 統計局が実施している統計調査などの結果の公表スケジュールを紹介 統計トピックス 統計局が実施している統計調査などを社会情勢(国民の祝日、記念日等を含む)を踏まえたテーマに分析・編集して紹介 統計表一覧(Excel集) 統計局が実施している統計調査などの統計表をダウンロードできるコーナー 総合統計書 結果の利用案内 統計局が実施している統計調査などの結果の入手方法を紹介(統計相談室,各調査担当課,統計図書館,刊行物・電磁記録媒体の販売先など) 政府統計公表・提供状況(府省別)(政府統計の総合

  • データマイニングの宝箱

    データマイニングに関することを、データの集め方から知識の獲得まで、幅広く丁寧に解説しています。データマイニングで用いられる知識発見技術は、バスケット分析・決定木・ニューラルネットワークなど多くの手法があります。だからといって全部を同時に利用することは考えられません。解析手法はそれぞれの役割があり、その目的に合わせて使い分けなければなりません。 それぞれの役割があると書きましたが、大きくわけると2つのタイプがあると思います。「データから質を探る」タイプと「データから未知の現象を予測する」タイプです。 この章では、「データの洗浄」から「知識発見の方法」を交えて知識発見を考えてみます。

  • Google

    世界中のあらゆる情報を検索するためのツールを提供しています。さまざまな検索機能を活用して、お探しの情報を見つけてください。

    Google
  • ソーシャルメディアはイケてるのか〜いま起きてること、これから起きること〜 | 野村総合研究所(NRI)

  • Open DATA METI | 経済産業省のオープンデータカタログサイト

    サイトは経済産業省がオープンデータを実践するために設置した試験サイト(β版)です。サイトは、データ活用に関心がある企業、NPO、個人等の方々から色々な意見をいただくことで、少しでも使い勝手の良いサイトにしていくとともに、個人情報等に配慮した上で、経済省のみならず政府全体におけるオープンデータ推進の検討に活用させていただくことも考えております。そのため、サイトでは、ユーザーの方々から様々な意見や要望をいただき、対して様々な意見や要望をいただく仕組みの一つとして、「DATA METI活用パートナーズ」を設置しております。この「DATA METI活用パートナーズ」の概要と申込についてはこのページのとおりとなりますので、御関心のある方は是非ご覧下さい。 なお、いただいたコメントを踏まえ、柔軟な修正を逐次していくことを考えております。そのため、利用規約も含め、予告無くサイトは変更される可能性

    Drunkar
    Drunkar 2013/02/01
    オープンデータの試験用サイト
  • 確率統計を学ぶにあたって 金谷健一 岡山大学工学部情報系学科

    確率統計を学ぶにあたって 金谷健一 岡山大学工学部情報系学科 1 確率統計は大学の一番難しい科目? 私の知っている人で(中には大学の理科系の先生もいる),確率統計は習ったがよく分からない という人が多い.私自身もそうであった.大学で確率統計を習ったが(私の場合は 3 年次であっ た),まったく分からなかった.期末試験のためにいろいろなを読んだが,どうしても理解でき ない.個々の例題の計算の仕方の説明を読めば,そのやり方は分かるし,導出も書いてあるので, そのようになるのだということに疑いは起きない.しかし,どうしても「分かった」という気に ならない.自分の頭で考えることができない.そのため覚えらないのである. 大学に入ると難しい科目をいろいろ学ぶ.特に 1 年次の解析学(微分積分学)と線形代数学(ベ クトルと行列)を学んだときは,あまりに抽象的な記述に愕然とした記憶がある.しかし,その

  • はてなブログ | 無料ブログを作成しよう

    我が家のダグウッド ダグウッドとはハナミズキのことである。昔、日からポトマックリバーの桜の苗木を送った返礼として、アメリカから送られて来たのが日での始まりで、アメリカ原産でアメリカヤマボウシともいうらしい。 最近では日でも、あちこちで、街路樹であったり、庭木であっ…

    はてなブログ | 無料ブログを作成しよう
    Drunkar
    Drunkar 2013/01/11
    評価方法の意義を理解して目的に則してやれと。
  • Free Datascience books

    Musings on data science, machine learning and stats. I've been impressed in recent months by the number and quality of free datascience/machine learning books available online. I don't mean free as in some guy paid for a PDF version of an O'Reilly book and then posted it online for others to use/steal, but I mean genuine published books with a free online version sanctioned by the publisher. That

  • はじめての「R」

    2023/02/06追記: slideshareが非常に使いづらくなってしまったため、speakerdeckに転載しました。 https://speakerdeck.com/masaha03/hazimeteno-r 補足記事を書きました。併せてご覧ください。http://m884.hateblo.jp/entry/2012/12/03/232431Read less

    はじめての「R」
  • 季節調整法 X-12-ARIMA について

    X-12-ARIMAはアメリカセンサス局(U.S. Census Bureau)で開発された季節調整法(Seasonal Adjustment)です。 日でも月次や4半期の統計の季節調整法として最もよく使われています。しかし、実際に使ってみようという場合、日語の資料が少なく、統計的な知識も必要なため、かなり高いハードルがあります。ここでは、とりあえず X-12-ARIMA を使ってみたいという人向けにページを作成してみました。実際に使って見ると、それほど難しいということはないので、多くの人に使ってもらえるようになればと思っています。 毎月の売り上げや4半期の決算数字を比較する場合、季節によって売り上げが変動することが多く、前月や前期と比較することが困難なため、普通は前年同月比や前年同期比を使います。しかし、前年同月比では最近の動きがよくわからないという欠点があります。X-12-ARIM

  • マルコフ連鎖モンテカルロ法入門-1

    ※ここで解説しているお天気推移モデルはオリジナルなものですので、数値・計算等にミスがある可能性が否めませんので、もし間違いを見かけた方は優しく教えていただけると助かります。 お天気推移モデルで理解するマルコフ連鎖モンテカルロ法。2状態離散モデルの解説を中心に、メトロポリス法の解説まで行った。 次は連続モデルや熱浴法・メトロポリスヘイスティング法の解説資料も作成したい⇒完成。以下のLINKを参照下さい。http://www.slideshare.net/teramonagi/ss-5344006 誤字を修正(2010/11/01)Read less

    マルコフ連鎖モンテカルロ法入門-1
  • 生態学データ解析 - 最尤推定法とは

    最尤推定 (さいゆうすいてい): 「最ももっともらしい」パラメーターの推定 「尤」の音読みは「ゆう」,訓読みは「もっともらしい (尤もらしい)」です. 尤度とは,ある確率論的モデルを仮定しているときに,その観測データが得られる確率 (あるいは確率密度) 簡単には,ある観測データに (あるパラメーターのもとで) 確率論的モデルが「どれぐらいあてはまっているか」を確率で表す尺度です 最尤推定とは,尤度を「手持ちの観測データのもとで,あるパラメーター値が得られる確率」とみなして (つまり尤度が未知パラメーターの関数とみなして),尤度を最大化するようなパラメーター値を探索する推定方法です 最尤推定法を使う手順は 尤度方程式を作る: 確率論的モデルを作り (データがどういう確率分布に従うか,確率分布のパラメーターの関数型はどうなってるか),それを数式として定義する……これが尤度方程式である 尤度最大

  • Python:統計機能に強みのpyvttbl : 分析技術とビジネスインテリジェンス

    今回は新しく見つけたライブラリの紹介と、これまで取り上げてきたライブラリの用途別整理を。まずはライブラリの紹介から。 ■pyvttbl http://pyvttbl.googlecode.com/hg/doc/_build/html/index.html ピボットテーブル、基礎統計量の取得、散布図やヒストグラムの作成など、Pandasとの共通点は多い。違いは、Pandasは時系列分析のためのデータ加工や、SQLライクなデータ処理機能が充実していること、pyvttblは分散分析やカイ2乗検定などの統計手法が準備されていることだろうか。アンケートデータの集計や分析は、Pandasよりもpyvttblの方が相性が良いと思った。プロット機能はこちらの方が少し親切な印象。基、自分はRDB人間なのでPandasをベースにこちらを補完ライブラリにしたいと思った。 ■Scatter Matrixの比較

  • 基地局データから“これまでにない”人口統計データを――ドコモの「モバイル空間統計」

    ケータイ基地局の運用データを街づくりに活用――。この秋、NTTドコモと東京大学がこんな取り組みを開始する。 今回の取り組みでドコモは、携帯電話の基地局に集まる利用者データを匿名化し、ドコモ端末の普及率などを加味した統計データに変換。時間ごとに変化する各地域の人口分布や人口構成、移動人口を把握できる「モバイル空間統計」データとしてまとめる。ドコモと東京大学は、統計データの信頼性を精査するとともに、統計データをどのような形で街づくりに生かせるのかを検討する。 サービスについて説明するNTTドコモ 先進技術研究所 所長の村瀬淳氏(写真=左)と、同ネットワークシステム 研究グループ 主幹研究員の岡島一郎氏(写真=右) これまでにない、人口統計データを生成可能に 基地局の運用データを活用するモバイル空間統計は、これまでにない人口統計データを生成できると、NTTドコモ 先進技術研究所の岡島一郎氏(ネッ

    基地局データから“これまでにない”人口統計データを――ドコモの「モバイル空間統計」