タグ

StatisticalMethodに関するhtktyoのブックマーク (33)

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • 量的研究と質的研究の連携に向けて - 社会学者の研究メモ

    足の調子が少し悪くてひきこもってます...。しかし手は動く。 筒井が所属する立命館大学人文科学研究所からの助成で、「人文学・社会科学における質的研究と量的研究の連携の可能性」研究会をスタートさせました。さしあたり3年間継続します。研究助成を申請する際に固定メンバーを10人ほど指定していますが、研究会はオープンにする予定ですので、興味のある方はぜひご参加ください。(9月19日に第1回研究会を開催予定。) 特に社会学では、質的研究や質的データを利用したモノグラフ的研究と、計量データを活用した量的研究のあいだでは、ほとんど協力関係もなく、また互いに妙な誤解を抱きあっている部分もありそうです。研究会では、あまり前提を置かずに互いの研究実践の特性に関する理解を深めることを通じて、合理的な「連携」のあり方を模索することが目指されます。 とはいえ議論の「とっかかり」は必要になると考えています。あくまで

    量的研究と質的研究の連携に向けて - 社会学者の研究メモ
  • 図(だけ)で説明する回帰分析 - 社会学者の研究メモ

    分かっているようで意外と分かっていないのが回帰分析です。回帰分析の考え方をできるだけ図だけで説明した資料を作りましたので、適宜ご参照ください。 「(ほぼ)図(だけ)で説明する回帰分析」(PDF) 主な内容は、以下のとおりです。 説明変数と撹乱項の相関の理解 予測値の信頼区間をプロットすることの重要性の理解 「変数をコントロールする」ということで曖昧に理解されている内容の理解

    図(だけ)で説明する回帰分析 - 社会学者の研究メモ
  • R packages for machine learning and statistical learning - 手習い録

    R package ElemStatLearn では, 統計学習の教科書 Elements of Statistical Learning に対する R package を紹介しましたが, これを紹介しているページ CRAN Task View: Machine Learning & Statistical Learning にある, 機械学習, 統計学習のための他の R パッケージを 以下のような項目にしました. 人工神経回路網 (neural networks) nnet: 単一隠れ層の人工神経回路網 決定木, 回帰木 rpart: CART のような木構造を作るのにお勧め. (base R に付属) mvpart: rpart を多変量の出力に対応した版. tree Weka + RWeka インターフェイス. Weka には, C4.5 の Java による実装 J4.8 などがあ

    R packages for machine learning and statistical learning - 手習い録
  • 統計的機械学習入門

    統計的機械学習入門(under construction) 機械学習歴史ppt pdf 歴史以前 人工知能の時代 実用化の時代 導入ppt pdf 情報の変換過程のモデル化 ベイズ統計の意義 識別モデルと生成モデル 次元の呪い 損失関数, bias, variance, noise データの性質 数学のおさらいppt pdf 線形代数学で役立つ公式 確率分布 情報理論の諸概念 (KL-divergenceなど) 線形回帰と識別ppt pdf 線形回帰 正規方程式 正規化項の導入 線形識別 パーセプトロン カーネル法ppt pdf 線形識別の一般化 カーネルの構築法 最大マージン分類器 ソフトマージンの分類器 SVMによる回帰モデル SVM実装上の工夫 クラスタリングppt pdf 距離の定義 階層型クラスタリング K-means モデル推定ppt pdf 潜在変数のあるモデル EMアル

  • これからはじめる人のための機械学習の教科書まとめ - EchizenBlog-Zwei

    最近では企業における機械学習の認知度も高まっていてエンジニアの求人募集でも「望ましいスキル:機械学習」というのをよく見かける。特にweb系の企業だと当たり前のように機械学習を活用した魅力的なサービスが生み出されているようだ。 そんなわけで先日書いた機械学習の入門記事もそれなりに好評で末尾の教科書リストも結構参考にしていただいた様子。ということで、これから機械学習をはじめる人のためにオススメの教科書を10冊ほどピックアップしてみた。 幸いにして機械学習の分野には良書が多い。5年前はナイーブベイズすら知らなかった私も、これらの教科書のおかげでなんとか機械学習を使えるようになりました!(個人の体験談です。効果には個人差があります) 参考: 機械学習超入門 〜そろそろナイーブベイズについてひとこと言っておくか〜 - EchizenBlog-Zwei 最初に既存の機械学習の教科書まとめを挙げておくの

    これからはじめる人のための機械学習の教科書まとめ - EchizenBlog-Zwei
  • 第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT

    今ほど統計解析が必要とされる時代はありません。オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しましょう! 読者にとってRは、世に溢れるデータの密林を切り開くための“ブッシュナイフ”となることでしょう(編集部) 統計解析の必要性とリテラシー 21世紀になって、経営学者の故ピーター・ドラッカー氏が言うところの知識労働者は、ますます統計解析を必要する局面が増えてきました。この状況は、20世紀後半から21世紀に起きた計算機能力の増大とインターネットの発展を基礎に、3つの大きな潮流が現れたことがキッカケとなっているように思います。その3つの潮流とは、オープンソース、オープンデータ、そしてオープンアイデアです。後ろの2つは今筆者が名付けました。 オープンソースは、皆さんがご存知のように、Linux、Apache、PerlPythonRubyなどのO

    第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT
  • Page not found

    All Microsoft Global Microsoft 365 Teams Copilot Windows Surface Xbox Deals Small Business Support Software Windows Apps AI Outlook OneDrive Microsoft Teams OneNote Microsoft Edge Skype PCs & Devices Computers Shop Xbox Accessories VR & mixed reality Certified Refurbished Trade-in for cash Entertainment Xbox Game Pass Ultimate PC Game Pass Xbox games PC and Windows games Movies & TV Business Micro

    Page not found
  • 数字は嘘をつかないけど。 - Vox

    昨日MIAUのシンポジウムについてブログを書きました。シンポジウムには統計の専門家である田村さんが登壇されており、新聞とネットの調査結果の違いについて議論がされ、またシンポジウムはニコニコ生放送でネット中継されており、その視聴者の方たちに対してアンケートを行うことができ、それはそれで生々しくて興味深かったと思います。 昨今はアンケートを行うことへの敷居がどんどん低くなっており、特にインターネットリサーチをやる人もどんどん増えており、それ自体はよいことだと思います。数字は嘘をつかないというのは当だと思います。だけれど、「誰に」「何を」「どうやって」聞くかによって、数字は簡単に変わってしまうものだという自覚をアンケートを行う側が自覚をもって行い、またデータを見る側もそこに気をつけてデータを見なければならないということを強く認識する必要もあると思っています。

  • クリック統計学に陥らない、とりあえず5つの方法 - 女教師ブログ

    クリック統計学をマスターする、ただ5つの方法 - 女教師ブログのB面クリック統計学エクセルや統計ソフトのボタンを「クリック!」することで統計解析を行う学問。最近の統計ソフトは、分析結果を提示する際に必要な係数や情報を、一回のクリックで一度に出力してくれる便利なものが多い。しかし、そうした便利さゆえ、「統計学とは何ぞや」ということをちっとも理解していないような、ひどい統計解析を行う立場。および、そうした立場を「統計はツールなんだし、数式なんて覚えなくていいじゃん」のように開き直る理論的態度。*1 1. 似た変数を統合する前に、単純集計・クロス表・グラフなどをつかって、「生データ」の特徴を徹底的に調べましょう。 たとえば、英語読解力、語彙力、発音の正確さ、流暢さなどが、すべて英語力に関係するものだからといって、それを統合していい理由は少しもありません。「似ている」「関係している」というのと、「

  • Rによる最適化、パラメータ推定入門 - yasuhisa's blog

    パラメータの推定、でもその前に optimize関数について 補足 パラメータの推定 ベルヌーイ分布 定式化(尤度関数) 尤度関数の実装 尤度関数の最適化(パラメータ推定) 正規分布におけるパラメータ推定 まとめ パラメータの推定、でもその前に統計におけるパラメータの推定というのは大体最適化問題に帰着します。「なんとか関数を(最大|最小)にするようなパラーメータほにゃららを求めたい」とまあこんな感じで。というわけで、パラメータ推定は置いておいて、Rで最大化問題、最小化問題をどう解くかというところを最初にやってみようと思います。最適化問題は離散最適と連続のほうの最適に分けられますが、ここでは連続についての最適化問題について考えることにします。 optimize関数について Rにおける最適化をするための関数はoptim関数、optimize関数があります(他にもnlsなどありますが、とりあえず

    Rによる最適化、パラメータ推定入門 - yasuhisa's blog
  • 自然言語処理における半教師あり学習のテキスト - 武蔵野日記

    最近移動続きであまり研究に時間は割けないのだが、は読めるということでを2冊、サーベイ的な記事を3(うち2はチュートリアルスライドつき)を紹介する。まず Semisupervised Learning for Computational Linguistics (Chapman & Hall/CRC Computer Science & Data Analysis) 作者: Steven Abney出版社/メーカー: Chapman and Hall/CRC発売日: 2007/09/17メディア: ハードカバーこの商品を含むブログ (4件) を見る を読む。このの著者の Steven Abney はブートストラッピングの理論的解析をした人で、 Steven Abney. Bootstrapping. 40th Annual Meeting of the Association fo

    自然言語処理における半教師あり学習のテキスト - 武蔵野日記
  • http://excelstatistics.mathlab.info/

  • HITS, 主成分分析, SVD - naoyaのはてなダイアリー

    ウェブグラフのリンク解析によるページの評価と言えば PageRank が著名ですが、もうひとつ Jon Kleinberg による HITS (Hyperlink-induced topic search)も有名です。最初の論文 Authoritative Sources in a Hyperlinked Environment は 1999年です。IIR の 21章で、この PageRank と HITS についての解説がありました。 HITS HITS はウェブページの評価に二つの軸を用います。一つが authority スコア、もう一つが hub スコアです。 例えば「Perl の情報が欲しい」という検索要求に対しては CPAN や 開発者である Larry Wall のホームページなどが重要度の高いページかと思います。これらのページは「Perl に関して信頼できる情報源」ということ

    HITS, 主成分分析, SVD - naoyaのはてなダイアリー
  • Science Cafe: Statistics for Linguists

    3月に始まった至ってインフォーマルな統計の勉強会です。 毎回、10人ほどの参加者が集まり好評です。言語研究に有効な統計的手法を、身近な言語学の例でもってわかり易く学んでいきます。 今のところ、メンバーは神大言語学の学生ですが、どなたに来て頂いても結構です。資料準備のため新たに参加を希望される方は、以下にご連絡頂ければ幸いです。 企画者: 竹安 大(thonsei (AT) yahoo. co. jp) 秋田喜美(akitambo (AT) kcc. zaq. ne. jp) 第1回(03/11/08) - 統計の基礎概念:統計を使って何ができるか - 今後の予定      資料 (pdf) 第2回(04/23/08) - カイ二乗検定I:計算方法と具体例      資料 (pdf) 第3回(05/07/08) - カイ二乗検定II:使用上の注意

  • FrontPage - 情報論的学習理論と機械学習の「朱鷺の杜Wiki」

    朱鷺の杜Wiki(ときのもり うぃき)† 朱鷺の杜Wikiは,機械学習に関連した,データマイニング,情報理論,計算論的学習理論,統計,統計物理についての情報交換の場です.これら機械学習関係の話題,リンク,関連事項,書籍・論文紹介などの情報を扱います. 更新されたページを確認するにはRSSリーダを使って右下のRSSリンクをチェックするか,最終更新のページを参照してください. ページの中でどこが更新されたかを見るには,上の「差分」をクリックして下さい. 数式の表示に MathJax を利用しています.数式の上でコンテキストメニューを使うと各種の設定が可能です.特に設定をしなくても数式は閲覧できますが,フォントをインストールすれば数式の表示がきれいで高速になります.詳しくは 数式の表示 のページを参照して下さい. ごく簡単なWikiの使い方がこのページの最後にあります.トップページやメニューなど

  • Winnow - 機械学習の「朱鷺の杜Wiki」

    Winnow† 目的変数が2値,\(n\)個の特徴量も全て2値の場合の逐次学習アルゴリズム. 線形関数 \(f=w_1x_1+\cdots+w_nx_n\) について,\(f\gt\theta\) なら 1 に,でなければ 0 に分類する.また,係数\(\alpha\gt 1\) を定める. 新たな事例,すなわち,長さ\(n\)の2値ベクトルと2値の目的変数の対が与えられたとき 正しく分類されたなら,重みはそのまま 誤分類された場合は 事例のクラスが1のとき,特徴ベクトルの要素 \(x_i\) が 1 のものは,その重み \(w_i\)を \(\alpha\)倍する. 事例のクラスが0のとき,特徴ベクトルの要素 \(x_i\) が 1 のものは,その重み \(w_i\)を \(\alpha\)で割る. 単純なアルゴリズムだが,PAC学習の観点から理論的な誤り率の限界,\(\alpha\)

  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
  • TAKENAKA's Web Page: 有意性検定の無意味さ

    The Insignificance of Statistical Significance Testing 統計学的な有意性検定の意味のなさ Johnson, Douglas H. 1999. The Insignificance of Statistical Significance Testing. Journal of Wildlife Management 63(3):763-772. Jamestown, ND: Northern Prairie Wildlife Research Center Home Page. http://www.npwrc.usgs.gov/resource/1999/statsig/statsig.htm (Version 16SEP99). この論文の存在は, 久保拓弥さん(北大)の ページで知りました. The Wildlife Soci

  • 検索エンジンの意味解析能力を考える | Moz - SEOとインバウンドマーケティングの実践情報

    ロボットと怖そうな機械グモだけど、よく頑張っていると思わない? それで知りたいのは、SEOやコンテンツの立案やウェブサイトの構築といった作業に、これがどのように関係してくるかということだよね? ここまでのことを踏まえて、いかに最適化すればいいのか僕なりに仮説を立てたので、それを挙げていこう。 サイトの構成は意味的に整理されたものに 検索エンジンが、どの語とどの語が互いに関連するというデータを活用しているのだから、サイト内のコンテンツの見取り図を作る際は、できる限り論理的に分類しておいて損はない。普通は、常識にしたがってやればうまくいくのだけど、いざというときはいつだって3つ目の図にある共起計算を利用できる。たとえば、このチキンストックのレシピは果たして「フランス料理」なのか「アメリカの伝統料理」なのか、なんてときには、すかさず共起計算をやってみよう。 関連する語/フレーズを使ったコンテンツ

    検索エンジンの意味解析能力を考える | Moz - SEOとインバウンドマーケティングの実践情報