タグ

statisticsに関するyamazのブックマーク (12)

  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • フィッシャーの「統計的方法と科学的推論」の訳者解説が素晴らしすぎる(その1) - Take a Risk:林岳彦の研究メモ

    編の方はフィデューシャル推測の項まで書いたのでもう良いかなあ、と思って終わりにして、今回から同書の「素晴らしすぎる訳者解説」のメモを書いていきます。 訳者の方は「渋谷政昭・竹内啓」さんなのですが、巻末の訳者解説が当に素晴らしく完成度が高いのです。「池上彰か!」とツッコミたくなるくらいその解説は分かりやすく明確です。 こんな素晴らしい解説文が絶版により埋もれてしまうのは大きな文化的損失ですので、来ならば全文引用したいところですが、色々な事情もありますので、フィデューシャル推測に関する部分だけを引用していきます。とはいっても長いので何回かに分けて見ていきます(かなり長丁場のシリーズになるかもしれません)。 同書201pの第3節の部分から引用していきます: 統計的推測の問題をはっきりさせるために、一つの例をあげて説明しよう。 今あるものの長さを測って、75.8cm、75.9cm、75.2c

    フィッシャーの「統計的方法と科学的推論」の訳者解説が素晴らしすぎる(その1) - Take a Risk:林岳彦の研究メモ
  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • Data Mining Survivor: dmsurvivor - Beyond Rattle: R for the Data Miner

    Subsections R: The Language Evaluation Exercises Assignment Libraries and Packages Searching for Objects Package Management Information About a Package Testing Package Availability Packages and Namespaces Basic Programming in R Principles Folders and Files Flow Control If Statement For Loop Functions Apply Methods Objects System Running System Commands System Parameters Misc Internet Memory Manage

  • [ ネコでもわかるモンティホールジレンマ] by DOFI-BLOG どふぃぶろぐ

    ゲームや日記を公開中。 --- a blog about games, life. my handle is 'd_of_i'.

  • 今だからこそ、「軽量なウェブサイト」を作ることが重要、というお話。 - Feel Like A Fallinstar

    最近はJavaScriptのライブラリ整備や、大きなモニターが増えたせいもあり、リッチな見た目のサイトが増えてきたなーって思います。 でも、その一方で、それ以上に増えている様相なのが「低速度回線」のユーザ。 今だからこそ、技術をきちんと理解して軽いウェブサイトを作るべきなんじゃないか、というお話を少し。 増えているのは、フレッツよりも「持ち歩きPC」「スマートフォン」のアクセス これは今木が運営する、とあるポータルサイトの利用者の接続速度の変化のデータです。 月間PVが大体150,000位で、割と昔からあるタイプのまじめなコンテンツのサイト。携帯は対応していませんし、IT系とかに偏ったコンテンツもありません。 見ると分かる傾向は ダイヤルアップ、実はあまり減っていない ケーブルはそこまで延びていない Unknownが年々増えている ADSL / 光(T1)も割合としてはむしろ減少傾向 グラ

  • アナリティクスアソシエーション (a2i) |アナリティクスの協議会

    セミナー オンライン オンラインセミナー「なぜ私たちは自ら生み出したKPIに追われるのか?」|2024/3/14(木) ウェビナーでは、マーケター、データ分析者、事業の意思決定者ら、専門家にとって有益な場となるよう、名著「測りすぎ――なぜパフォーマンス評価は …

    アナリティクスアソシエーション (a2i) |アナリティクスの協議会
  • 統計処理ソフト R 入門 講習会資料

    講習会の目的 講習会は, R についての自習の基盤をつくることを目指します。 たとえ初心者向けの数時間の入門講習でなく1年間の毎週の演習授業であっても,R に関してすべてを説明するのは不可能だと思われます。 R の世界は,縦にはそこそこ深く,横には果てが見えないほど広いです。 CRAN に登録されている R のパッケージは 1000 を超えました。 よって,受講者の幅も広いことですし,受講者各自にとってぴったりな統計解析の実用的な解説をするのはあきらめて, 各自が必要に応じて情報を探し,見つけたものを難なく活用できるようになること,を目標にしました。 ここに自分の求めている分析手法や作図法などの答えがあるとは期待しないで下さい。それは帰ってからのあなたの楽しい仕事です。 R の利用と R 言語 R の根幹は R 言語のインタプリタであり,ユーザはR言語を駆使することでRを操作します。 S

  • FrontPage - 情報論的学習理論と機械学習の「朱鷺の杜Wiki」

    朱鷺の杜Wiki(ときのもり うぃき)† 朱鷺の杜Wikiは,機械学習に関連した,データマイニング,情報理論,計算論的学習理論,統計,統計物理についての情報交換の場です.これら機械学習関係の話題,リンク,関連事項,書籍・論文紹介などの情報を扱います. 更新されたページを確認するにはRSSリーダを使って右下のRSSリンクをチェックするか,最終更新のページを参照してください. ページの中でどこが更新されたかを見るには,上の「差分」をクリックして下さい. 数式の表示に MathJax を利用しています.数式の上でコンテキストメニューを使うと各種の設定が可能です.特に設定をしなくても数式は閲覧できますが,フォントをインストールすれば数式の表示がきれいで高速になります.詳しくは 数式の表示 のページを参照して下さい. ごく簡単なWikiの使い方がこのページの最後にあります.トップページやメニューなど

  • オススメされた統計学本を列挙 - ミームの死骸を待ちながら

    冬に二週間シンクタンクでインターソすることになった。クリスマスとか関係ない。インターンで扱うテーマに統計の理解が必要となったため勉強したいという遅延学習法精神で、今のうちに統計学をざっくり勉強しておきたい。そもそも二年前、ブログを立ち上げた理由は「インターンの内容(Ruby)を先走って勉強する」ためでした。性格変わってない。 ところが僕の持っている統計は こんなもんなので*1、何か一冊「ガチの教科書」がほしいなと思った。生物で言うと Molecular Biology of the Cell みたいな。そこでTLに聞いてみたところ、いろいろ教えてくれました。はてな人力検索とかもう不要ですね。大した答え来ないし*2 以下のメモは自分のために。といいつつアフィを張るのは下心。 統計学入門 (基礎統計学) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/

    オススメされた統計学本を列挙 - ミームの死骸を待ちながら
  • 統計的にテキスト解析 (Ⅰ)(Ⅱ) - コーパスいぢり

    金明哲先生がご自身の"Jin's Page"で公開されているESTRELAのPDFですが、現在は「統計的にテキスト解析」というシリーズが刊行中です。現在は(Ⅰ)と(Ⅱ)がアップされていて、前者は計量文献学・コーパス言語学・テキストマイニングについての基礎知識で、後者は正規表現などを使ったテキスト処理入門。 あくまで初心者向けの記事ですが、それだけに自分の論文の冒頭部などで言及するのに便利かも。何と言っても、オンラインで無償公開されていることに大きな意味がある。(Ⅲ)の公開が非常に楽しみ。 ・統計的にテキスト解析 (Ⅰ) → http://www1.doshisha.ac.jp/~mjin/R/200803_56.pdf ・統計的にテキスト解析 (Ⅱ) → http://www1.doshisha.ac.jp/~mjin/R/200804_57.pdf

  • Jストリームはブラウザ、映像アプリケーションのプラグイン調査を実施 ~ Flash Player、Windows Media Playerの普及率は95%以上 ~ | 1016|2007|プレスリリース|株式会社Jストリーム

    TOP / ニュース / プレスリリース / Jストリームはブラウザ、映像アプリケーションのプラグイン調査を実施 ~ Flash Player、Windows Media Playerの普及率は95%以上 ~ 株式会社Jストリーム(マザーズ:4308 代表取締役会長兼社長:白石 清)では、インターネットによるリッチコンテンツ利用のベースとなるOS、ウェブブラウザ、映像再生アプリケーションのプラグインについての調査を実施いたしましたので、結果を発表いたします。 ■調査方法 下記ジャンルの複数のポータルサイトにおいてバナー掲載を行い、アクセスユーザーのPC環境に応じた内容表示を行う際のデータを個人が特定されない形で収集・集計。 調査期間 :2007年9月10日~9月16日 調査対象となったポータルサイトのジャンル: ビジネス、テクノロジー、エンターテインメント、ウーマン&ヘルス、ジョブ&キャリ

    Jストリームはブラウザ、映像アプリケーションのプラグイン調査を実施 ~ Flash Player、Windows Media Playerの普及率は95%以上 ~ | 1016|2007|プレスリリース|株式会社Jストリーム
    yamaz
    yamaz 2007/11/19
    ブラウザなどの調査結果
  • 1