タグ

統計に関するamigogrjのブックマーク (38)

  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • Attractors Lab

    アトラクターズ・ラボ株式会社は、「スタイルアクト株式会社」に社名を変更いたしました。 また、以下の通り連絡先が変わりましたので、お知らせいたします。 〒104-0061 東京都中央区銀座六丁目2番1号Daiwa銀座ビル7階 Tel.03-5537-6333 Fax.03-5537-6334 各自のメールアドレスにつきましては、@以降が「styleact.co.jp」に変わります。 スタイルアクトのホームページはこちらです。 http://www.styleact.co.jp/

  • Facebookページ運用中の115社に聞いた!「ファン獲得単価」等の25個の運用状況に関するリサーチ結果を大公開!/『Facebookページ 運営者白書』の結果発表 : (旧)ガイアックスソーシャルメディア ラボのブログ

    他の企業がどのようにFacebookページを運営しているか? 気になりませんか? 以前、『Facebookページ 運営者白書』、始めました。の記事でご協力をお願いした『Facebookページ 運営者白書』のアンケート結果がまとまりました。 今回はその25問に渡るアンケート結果を大公開します!! 今後、ここからの考察も深堀りしながら考えていきたいですが、まずはそのままの結果を発表させて頂きます。皆さんの運営の参考になりますと嬉しいです! ※次回集計に向けて※ 「次回集計ではこんなことを知りたい!」などご希望ありましたら、記事下のコメントプラグインより教えて頂けますと幸いです。 ※アンケートにご協力頂いた方、ローデータの提供をご希望の方へ※ info@grouprise.jpからお問い合わせを頂ければと思います。メールを頂戴出来ましたら主幹のグループライズさんよりおってご連絡差し上げます。 目

    Facebookページ運用中の115社に聞いた!「ファン獲得単価」等の25個の運用状況に関するリサーチ結果を大公開!/『Facebookページ 運営者白書』の結果発表 : (旧)ガイアックスソーシャルメディア ラボのブログ
  • 子ども・子育て本部ページ移転のお知らせ - 内閣府

    アクセスされようとしたページは移転しました。 アクセスいただき、ありがとうございます。 子ども・子育て部ページは、URLが変更されました。 御迷惑をおかけし、誠に申し訳ございません。 大変お手数ではございますが、ブックマークなどされている場合は、移動先のページへ変更などお願いいたします。 Thank you for your access. Sorry. This web pages has moved. 新しいページへの移動は、下記をクリックしてください。 Please access to new URL from each page by clicking on following links. Thank you.

    子ども・子育て本部ページ移転のお知らせ - 内閣府
  • 都内区市町村マップ|東京都

    このサイトの考え方|使い方ヘルプ|個人情報の取り扱い|リンクについて|著作権について 《お問い合わせ》 東京都庁 〒163-8001東京都新宿区西新宿2-8-1 《地図》 電話03-5321-1111(代表) 《電話番号一覧》 ©2007-2008 TOKYO METROPOLITAN GOVERNMENT ALL RIGHTS RESERVED.

  • 保育所の状況等について|東京都

    保育所の状況等について 引き続き保育サービスの拡充を積極的に推進します! 平成22年7月13日 福祉保健局 平成22年4月1日現在の東京都における保育所の設置状況及び保育所入所待機児童数についてお知らせします。 都は、平成20年度から3年間で定員1万5千人分の整備を行う「保育サービス拡充緊急3か年事業」を実施するなど、待機児童解消に向けた取組を進めています。 就学前児童人口の増加や経済情勢の悪化等により、昨年4月の待機児童数が急増したことから、平成21年度の整備目標を当初計画の1.5倍に引き上げ、保育所等の施設整備にかかる事業者、区市町村の負担を軽減する都独自の支援を実施してきました。 こうした取組により、平成21年度の整備数は目標を大きく上回りましたが、待機児童数は対前年比で496人の増加となりました。 今後は、東京都保育計画(平成22〜26年度)に基づき、保育サービスのさら

  • 東京都23区の待機児童数の比較 | 小田るいブログ

    待機児童で困っている人の割合が高いのは港区・中央区。絶対数が不足しているのは、世田谷区、板橋区。がんばって待機児童を減らしたのは文京区、台東区。 港区、中央区は、高層タワーにニューファミリー層が移ってきたことで、 就学前児童数が増加したことが数値にも如実に出ています。(下図) 待機児童数の絶対数として不足しているところは、世田谷区、板橋区、練馬区、足立区と続きます。 (就学前児童数から見ると板橋区が一番環境が整っていないといえるかも)(下図) こちらが平成21年と平成20年の比較表です。文京区と台東区が待機児童を減らしているのに注目! 就学前児童数も増えている中で着実に対策をしている様ですね(下図) 以上、東京都「保育所の状況等について」からの引用でした。 僕ら子育て世代は、政府や区が何かやってくれるまで待つのではなく、 自分たちで声をあげて変革を促していかなければなぁと思います。

  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • ライフアーキテクト・ツール | 株式会社プラチナ・コンシェルジュ

    キャッシュフローやローン、必要保障額試算のシミュレータや家計簿など個人の生涯設計に役立つさまざまなツール、またそのロジックを提供します。 金融機関様の営業ツールやコンテンツ作成も承っております。目的や使い方などご要望に応じて仕様をご相談の上、納品形態も臨機応変に対応可能です。お気軽にご相談下さい。 >お役立ちツールはこちら 実績 日FP協会の「ライフプラン診断」にロジックを提供しています。9つの質問に答えるだけで、自分に近いライフスタイルの将来家計を診断できるツールです。このロジックが、金融庁NISA特設ウェブサイトの「ライフプランシミュレーション」にも採用されています。

    ライフアーキテクト・ツール | 株式会社プラチナ・コンシェルジュ
  • 3週間でやりなおす「高校数学の教科書」

    習うより慣れろ、学ぶより真似ろ。 やりなおし数学シリーズ。いつもと違うアタマの部分をカッカさせながら、3週間で一気通貫したぞ。もとは小飼弾さんへの質問「数学をやりなおす最適のテキストは?」から始まる。打てば響くように、吉田武「オイラーの贈物」が返ってくる……が、これには幾度も挫折しているので、「も少し入りやすいものを」リクエストしたら、これになった。 書の特徴は、「つながり」。アラカルト方式を改め、高校数学の体系を一化しているという。なるほど、上巻の「数と式」の和と差の積の形に半ば強引に持ち込むテクは、下巻の積分の展開でガンガン使うし、図形と関数はベクトルと行列の基礎訓練だったことに気づかされる。ベクトルが行列に、行列が確率行列に、さらに行列がθの回転運動や相似変換に「つながっている」ことが「分かった」とき、目の前がばばばーーーっと広がり、強制覚醒させられる。 上巻 1章 数と式 2章

    3週間でやりなおす「高校数学の教科書」
  • 【2011年5月最新版】直近決算発表に基づくmixi、GREE、Mobage、Amebaの業績比較:In the looop:オルタナティブ・ブログ

    国内4大ソーシャルアプリ・プラットフォーム、mixi、GREE、Mobage、Amebaの2011年1-3月期の四半期決算発表が出揃った。現在、4社の外部環境は、多機能携帯の成熟やスマートフォンの急成長、さらにFacebookなど海外勢の急追などで激変期にある。それらを踏まえ、今回の調査では、現業績やサービス比較に加え、各社の戦略などもあわせて分析してゆきたい。 なお,この分析レポートは,各社が投資家向けに公表している最新の決算報告,および広告代理店・クライアント向けに発行している媒体資料を主要な情報ソースとしている。あわせて、ネットレイティングス社「Neilsen/NetRatings NetView」およびビデオリサーチインタラクティブ社「Mobile Media Mesurement」による視聴データ調査、関係者ヒアリングもあわせ、多面的な考察を試みた。 また、当記事においては,それ

    【2011年5月最新版】直近決算発表に基づくmixi、GREE、Mobage、Amebaの業績比較:In the looop:オルタナティブ・ブログ
  • (非計量さん向けの)統計学の話:バイアス編 - 社会学者の研究メモ

    (今回はですます調でいく。いや行きます。) まずは、私の後輩や知人たちが書いたです。↓ エスノメソドロジー―人びとの実践から学ぶ (ワードマップ) 作者: 前田泰樹,水川喜文,岡田光弘出版社/メーカー: 新曜社発売日: 2007/08/03メディア: 単行(ソフトカバー)購入: 6人 クリック: 1,065回この商品を含むブログ (99件) を見る このなかに、次のような文章があります。 どのような研究に対しても、その主張の妥当性を、そこで採用されている方法と無関係に論じることはできません。だから、「事例の数」やそこから得られる「一般性」を問う前にまず、ある研究が明らかにしようとしていることが、そもそも事例の数によって保証される種類のものなのかどうかということ自体を考えなくてはなりません。 このことは言ってみれば「当然」のことなのですが、研究者の間ではあまり考えぬかれていない重要な論点

    (非計量さん向けの)統計学の話:バイアス編 - 社会学者の研究メモ
    amigogrj
    amigogrj 2011/05/17
    / [社会学][社会調査](非計量さん向けの)統計学の話:バイアス編 – B!
  • (非計量さん向けの)統計学の話:誤差編 - 社会学者の研究メモ

    今回は「誤差」編です。 誤差について説明するためには、どうしても「観察(observation)」の次元に話を差し戻す必要があります。前回に引き続いて「年収」を説明するための観察をする場面を考えます。次のように考えてください。 年収の観察値 = 性別 + 年齢 + ... + 学歴 + 様々な観察要因 最後の「様々な観察要因」ですが、いわゆる標抽出(サンプリング)による値への影響はさしあたりここに入ります。とはいえ、観察要因による観察値への影響は標抽出からのみ生じるわけではありません。というより、「センサス(全数調査)/標(部分)調査」という区別はある程度便宜的な区別なのです。 ある値(年収でもなんでも)が観察されるということは、特定の手続で、特定の時間と場所で行われたときの観察値です。観察という手続を「人」単位で考えたとき、対象「者」全員を観察することはセンサスですが、そうして観察

    amigogrj
    amigogrj 2011/05/17
    / [社会調査](非計量さん向けの)統計学の話:誤差編 – B!
  • 統計局ホームページ/日本の統計 2024-第2章 人口・世帯

    〒162-8668 東京都新宿区若松町19番1号 電話 03-5273-2020(代表) ©1996 総務省(法人番号2000012020001)統計局 所在地・交通案内 サイトの利用について

  • 「30年で大地震が起こる確率が87%」のときの「1年間に大地震が起こる確率」 - doitmyself1001の日記

    今日はてなブックマークを見ていたら次のようなものを発見した。 30年で大地震の確率は87%・・浜岡停止の最大の理由だ。確率計算のプロセスは不明だが、あえて単純計算すると、この1年で起こる確率は2.9%、この一カ月の確率は0.2%だ。原発停止の様々な社会経済的コストを試算するために1カ月かけても、その間に地震が起こる確率は極めて低いはずだ。 http://twitter.com/#!/HeizoTakenaka/status/67726323170283520 http://togetter.com/li/133823 基的にこのブログは自分の作ったアプリを紹介するブログであり、他人の批判めいたことは書きたくないがいくらなんでも適当すぎる。そう思ったのでざっくりと計算してみた。ざっくりと計算してみるというだけなので、二つ仮定を置く。 「30年で大地震の確率は87%」というのは「30年間で一

    「30年で大地震が起こる確率が87%」のときの「1年間に大地震が起こる確率」 - doitmyself1001の日記
  • 質的研究と量的研究について - 社会学者の研究メモ

    とある出版企画でそういうお話を書かなければいけないので、社会学におけるいわゆる「質的研究」と「量的研究」の区別についてメモを書いておく。 結論から言うと、次のように考えるとミスリーディングである。つまり、「まずある<理論>があって、それを<実証>する手段として質的な研究と量的な研究がある」という考えである。こういう考え方は、混乱のもとであるから、避けたほうがよい。多くの社会調査論のテキストでは調査手段の選択として「質的調査」と「量的調査」を選択することがあるかのように書かれているが、少々説明不足である。そうではなく、さしあたり量的研究とその他のタイプの研究が、量的研究とどのような関係にあるのか、と考えたほうがスッキリする。 分野外の研究者からすれば見えにくいが、実際には量的研究と言っても様々である。が、現状からして、「複数のパラメータを含むモデルを構築し、それをデータに当てはめて統計学的推

    質的研究と量的研究について - 社会学者の研究メモ
    amigogrj
    amigogrj 2011/05/10
    量的研究とその他、という区分だが、それはどうだろね。
  • 「俺の邪悪なメモ」跡地

  • 「YouTubeやニコ動が音楽購入の阻害要因にも」日本レコード協会が分析 

  • 生還した戦闘機が教えてくれること ~ 選択バイアスの罠 - Feel Like A Fallinstar

    久しくご無沙汰しておりました。 書くネタ自体は山ほどあるんですが、業が凄い勢いで動いているのでそっちに集中していましたです。 さて、たまには分析チックなお話を。統計でガチガチの石頭になってしまわないように、常に僕が気をつけていることの1つが「選択バイアスの罠」です。 生還した戦闘機、しなかった戦闘機 あ、ちなみに、いまきは別に統計や分析の(アカデミックな意味での)専門家ではないので、そのあたりはご容赦を(汗 時に1940年ごろ。 世界は第二次世界大戦の真っ只中です。 統計学者のエイブラハム・ワルドという方が戦闘機の脆弱性について調査していたそうです。 帰還した戦闘機の大量のデータが彼の元に届きます。 「入手したデータどれもが、戦闘機のある部分の被弾頻度が他の部分よりも過度に多いことを示していた。」 さて、ここからどういう結論を導けばいいのでしょうか? (ちょっと立ち止まって考えてから読ん

  • 海外ネタつれずれ:都道府県のワーストを描いた地図を作ってみた

    Powered By 画RSS February 14, 2011 都道府県のワーストを描いた地図を作ってみた 「The United States of Shame (CHART)」(恥のアメリカ合衆国)という地図が話題になっていました。 アメリカには50の州が存在しますが、この地図ではそれぞれの州に当てはまる「ワースト」なデータを名前にしてしまいました。地元の人たちにとっては迷惑な話ですが、面白いし、興味深いですね。ミシガン州は失業率が高いとかわかりやすいのもありますが、ニューヨークペンシルヴェニア州(指摘してくださってありがとうございます)では放火が多いとは知りませんでした。アメリカには州がありますが、日には都道府県があります。しかも47ですから、アメリカと同じように「ワースト」を当てはめることができるのではないでしょうか。 ということでありきたりに作ってみました。 この地図を作製