統計に関するtochiowのブックマーク (83)

  • データサイエンティストサミット 2014に参加してきた | DevelopersIO

    データ分析・活用から、成長と収益を生み出す!気鋭のデータサイエンティストが大集合!:データサイエンティストサミット 去年2013年12月に開催された第1回からおよそ7ヶ月。早くも今年度のイベントとして開催告知されていたので申込み。2014/06/27(金)に参加して来ました。 データサイエンティストサミット 2013に参加してきた | Developers.IO 開催場所は秋葉原コンベンションホール - AKIHABARA Covention Hall@秋葉原。弊社オフィスも秋葉原で、会場も駅を挟んですぐという事でアクセスもあっという間でした。駅からすぐ近くの建物というのも嬉しいですね。 こちらは会場入口。例によって会場内は写真撮影禁止のようでしたので、ここからは文字と引用画像や動画等を踏まえてセッション内容をレポートして行きたいと思います。では開店! 目次 10:00 - 12:30【S

    データサイエンティストサミット 2014に参加してきた | DevelopersIO
  • OPEN METI

    経済産業省は、約60年間にわたり日経済の変化と歴史を「年報」に刻みつづけています。OPEN METIプロジェクトではその3万ページを超える貴重な記録の解析を始めました。あの時、日と世界はどう動いていたのか。日はどのような政策に取り組んでいたのか。第1弾は「貿易」をテーマに年報の解析データと様々なデータから日と世界各国の経済の動きを可視化していきます。経済産業省は、約60年間にわたり 日経済の変化と歴史を「年報」に刻みつづけています。 OPEN METIプロジェクトではその3万ページを超える 貴重な記録の解析を始めました。 あの時、日と世界はどう動いていたのか。 日はどのような政策に取り組んでいたのか。 第1弾は「貿易」をテーマに 年報の解析データと様々なデータから 日と世界各国の経済の動きを 可視化していきます。

  • 統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!

    稿では統計学・データマイニング・機械学習関連書籍について 内容が易しいこと。数学力(特に微積・線形代数)を求められないこと 入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと 実務に繋げやすいこと。 持ち運びしやすいこと。忙しい新社会人が通勤中や休み時間ポケットからさっと取り出し、継続して勉強出来ること を主眼に選定したお薦め書籍を紹介します。 (満たせない要望も多いですが) 主な対象者は、文系で数学や統計学をやってこなかった、 プログラミングもわからない(Excelで四則演算やマウス操作くらいは使える) けどいつかマーケティングやデータマイニングやってやるぜ! って考えてる新卒の方です。 筆者自身は経済学科出身の文系で、あまり数学力に自信がないなりに Web企業でデータマイニングをしているという人間です。 ここで紹介している内容で 「統計学・機械学習・データマ

    統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!
  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
  • 機械学習の理論と実践

    SACSIS2013でのチュートリアル講演資料です。機械学習の導入:背景、手法、理論、応用)、実践:オンライン学習+線形分類で実際作ってみる、使う際の課題、発展:分散+リアルタイムでの機械学習(Jubatus)、深層学習(Deep Neural Net)についてまとめましたRead less

    機械学習の理論と実践
  • R言語で統計解析入門: 目次1 テクニカルデータプレゼンテーション  梶山 喜一郎

    Technical Data presentation in R コピペで学ぶ Rでテクニカルデータプレゼンテーション 1.基礎統計解析編 グラフィックス・リテラシ-教育: 「図学 I ・図形情報 I ・統計学」科目 修了後のコースウェア 福岡大学工学部図学教室   梶山 喜一郎 ・つまみいで,学習しないように願います. ・データの可視化を体系・系統だったスキルにするために順を追って学習する. ・統計ブームに乗っている学習者も先人に感謝の気持ちを.さらに, ・確かなスキルにするために,教科書・解説書を理解し,Rスクリプトで確認. A. はじめに--ここは統計・解析の必要を味わった後で読めばよい まず,統計の手続きを実行する.慣れたら統計的に考えよう. 学校の統計学を復習--買った教科書とノートをまた読むだけ a. 測定と尺度 Measurement and scale b. 記述統計学の

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

    tochiow
    tochiow 2013/03/07
    狭い日本(東京)の人口動態はそんなに単純ではないんだなぁ
  • 《Gunosy》開発チームが厳選、WEB業界人が読むべき“統計学”の必読書ベスト5 | キャリアハック(CAREER HACK)

    いまWEB業界で最もホットなトレンドの一つである“統計学”。その基を学ぶために読んでおくべき書籍を、注目のニュースキュレーションサービス《Gunosy》の開発チーム(福島さん・吉田さん・関さん)に伺った。 Gunosy開発チームが選ぶ、“統計学”の必読書とは? いま、WEB業界で最もホットなトレンドの一つとなっている“統計学”。その基的な知識を学ぶべく、前回、“超高精度なレコメンド”で話題のニュースキュレーションサービス《Gunosy》を手がける福島良典さん、関喜史さん、吉田宏司さんに、“WEB業界人のための統計学入門”と題して簡単に講義をしていただいた。 ※ 前回の記事はこちら 《Gunosy》開発チームから学ぶ、WEB業界人のための"統計学入門" その内容を踏まえつつも、より体系だててしっかりと“統計学”を押さえるためには、やはり“”を読むのが一番だという。そこで今回は、Guno

    《Gunosy》開発チームが厳選、WEB業界人が読むべき“統計学”の必読書ベスト5 | キャリアハック(CAREER HACK)
  • 世界経済のネタ帳 - 世界の経済・統計 情報サイト

    世界の経済・統計 情報サイト。世界200ヶ国の統計データをはじめ、コモディティ、為替などグローバルな視点による多数のコンテンツを掲載。

    世界経済のネタ帳 - 世界の経済・統計 情報サイト
    tochiow
    tochiow 2012/11/19
    ブクマの評価を見るとこれくらいのサマリで良いのかぁ。許諾が必要そうなデータがあるけどいいのかなぁと思ったり。
  • wikipediaの隣接市区町村の記載をデータベース化したものをcsvで公開 - 蟻の実験工房(別館ラボ)

    思いがけないリクエストがありましたので1年くらい前にやっていたwikipediaの隣接市区町村の記載をデータベース化したものをcsvで公開します。 http://spnene.antlabo.jp/data/city_rinsetsu_utf8.csv 簡単にいうとwkipediaで各市区町村の説明が記載されているページがあります。 このページから「隣接市区町村」の記載部分を抜粋して市区町村の隣接のつながりをデータベース化したものです。 ちなみにそのデータと統計情報を使った可視化マップはこちらです。 http://spnene.antlabo.jp/ [データのフォーマット] ID(元),県名(元),市区町村名(元),ID(先),県名(先),市区町村名(先) [取り扱いの注意] ・作成したのは2011年6月の市区町村をベースとしています。その後の統廃合には対応していません。 ・wikipe

    wikipediaの隣接市区町村の記載をデータベース化したものをcsvで公開 - 蟻の実験工房(別館ラボ)
  • Gephi, オープンソースのグラフ可視化・操作ソフトウェア

    Gephi が再び Google Summer of Code (GSoC 2011) に認定されました! Google Summer of Code は、世界各地の学生がオープンソースプロジェクトに貢献することができるたいへん優れたプログラムです。詳細はこちら » 応用例 探索的データ解析: リアルタイムでのネットワーク操作による直感的分析。 リンク解析: 特にスケールフリーネットワークにおけるオブジェクト間関係の根構造の明確化。 ソーシャルネットワーク分析: さまざまなコミュニティ組織やスモールワールドネットワークをマップ化できるソーシャルデータコネクタを簡単に作成可能。 生物学的ネットワーク解析: 生物学的データのパターンを表現。 ポスター制作: 高解像度の印刷可能グラフで学術研究成果をプロモート。 詳細はこちら » 各種のメトリクスを用意 中心性 (Centrality): 社会

  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • 〈統計学へのお誘い本リスト(11 Nov. 06 版)〉 - leeswijzer: een nieuwe leeszaal van dagboek

    → アップデート:〈6-September-2011版〉. 数理統計研修の受講生から,「統計学の参考図書を紹介してほしい」との依頼があったので,下記のような「お誘いリスト」をつくってみた.“門前”から“門”までの「参道」がやや長い気がするが,そこは気の迷いや逡巡が憑いてまわる相手のために,ということでご容赦を.また,いったん“入門”してしまった後は,手法ごとにそれぞれ適切な(中級書)がきっとあると思うが,上のリストではそこまでは考えていない.ただし,ぼくの担当している講義が「実験計画法」だったりするので,この分野については数冊選んで,リストに付けた.なお,〈R〉に関する参考書は別のリストを参照されたい. ご意見などありましたら,ご連絡ください. 門前で迷っている人のためのコミック系入門書 高橋信『マンガでわかる統計学』(2004年7月刊行,オーム社,ISBN:4274065707→版元

    〈統計学へのお誘い本リスト(11 Nov. 06 版)〉 - leeswijzer: een nieuwe leeszaal van dagboek
  • 地方財政情報館/財政用語小辞典

    TOPPAGE>財政用語小辞典 財政用語小辞典        (トップページに戻る) あ 一時借入金 一般会計・特別会計 一般財源化と交付税措置 一般財源と特定財源 応能原則・応益原則 か 会計年度 外形標準課税 介護保険特別会計 課税客体、課税標準、税率 課税自主権・超過課税・不均一課税 監査委員 基金 起債許可制度の廃止と協議制 起債充当率 基準財政収入額 基準財政需要額 義務的経費 経常収支比率 決算 決算統計と普通会計・決算カード 減税補填債・減収補填債 公営企業 公会計改革 公共事業費 公債費 公債費比率・起債制限比率・実質公債費比率  交付税特別会計・交付税特会借入金 交付税率 国庫委託金 国庫支出金 国庫負担金 国庫補助金 コミュニティ・ファンド さ 財政再建団体 財政力指数 歳入歳出 債務負担行為 三位一体改革 自主財源・依存財源 指定金融機関・ペイオフ 実質収支・単年度収

  • 統計局ホームページ/東日本大震災関連情報

    東日大震災に関連する政府の公式サイトへのリンク 東日大震災関連情報(総務省) 政府の最新の対応状況(首相官邸) 総務省統計局・政策統括官(統計基準担当)の統計調査等関連の取り組み 被災地域の統計情報 統計調査の対応 ※各府省における災害関連統計情報(e-Stat) の項目は、政府統計の総合窓口「e-Stat」掲載の統計表です。 被災地域に関する統計情報 平成24年就業構造基調査 東日大震災の仕事への影響に関する結果-岩手県・宮城県・福島県-(速報) 総務省統計局では,平成24年10月に実施した平成24年就業構造基調査の全都道府県を集計した結果(平成25年7月公表予定)に先立ち,震災で大きな被害を受けた岩手県,宮城県及び福島県の3県について,震災による仕事への影響の状況を公表しました。 この結果は岩手県,宮城県及び福島県において回収された調査票を集計したものです。岩手県,宮城県及び

  • Microsoft R Application Network - The Microsoft R Portal

  • World Bank Open Data

  • 男の方が失業率高い時代 「あまり給料にこだわるな」

    景気低迷で肉体労働などの求人が減り、女性より男性の失業率の方が高くなってきている。福祉分野などの成長で、「女性優位」とも報じられている。しかし、識者はむしろ、男性が「高給」にこだわり過ぎていることを指摘する。 男女の失業率格差は、最近拡大しており、2010年3月には、1.3ポイント差までになった。これは、08年9月のリーマン・ショック後から顕著になり始めた傾向だ。 男性多い業界は失速、女性多い業界は成長 総務省の労働力人口統計室では、その理由について、こう分析する。 「特に、建設業、製造業に影響が大きく、男性の就業者数が減って失業が発生しました。逆に、女性が多い福祉・医療などの成長分野は、就業者数が増加する傾向にあるわけです」 統計によると、主婦が女性の中で圧倒的に多かった時代は、男性の方が失業率は高かった。そして、男女雇用機会均等法の成立前年の84年からは、女性の社会進出が進んだが、バブ

    男の方が失業率高い時代 「あまり給料にこだわるな」
    tochiow
    tochiow 2010/07/07
    伸びる余地があったと見る方が自然
  • Amazon CAPTCHA

    Amazon CAPTCHA
  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ