タグ

statisticsに関するjjzakのブックマーク (94)

  • 機械学習のPythonとの出会い(1):単純ベイズ基礎編

    Statistics Favorites 0 Downloads 0 Comments 0 Embed Views 0 Views on SlideShare 0 Total Views 0 機械学習Pythonとの出会い(1):単純ベイズ基礎編 — Presentation Transcript 機械学習Pythonとの出会い (1) 単純ベイズ:入門編 神嶌 敏弘 ( http://www.kamishima.net/ ) Tokyo.Scipy #4 (2012.06.18) 1 自己紹介• 専門について • 機械学習やデータマイニングが専門と名乗ってます • PRMLとか翻訳しましたが,変分ベイズとか,MCMC とか複雑 なことは全然してません • 手法を深掘りすることよりも,新しい問題設定を考えて,できるだ け簡単な方法で解くようにしたいと思ってます• NumPy / Sc

  • Emacs + ESSでR(for Windows users) - もうカツ丼はいいよな

    むかーしむかしにWindowsでESSを使う方法についてメモったことがあるのですが(認証がかかっています)、今から見ると古いだけじゃなくて割といい加減なこと書いてるのにうっかり放置してたら某所でふわっと紹介されてしまったのでさすがにアレだなと思ってちょっと急いで書き直しました。 はじめに Rを便利に使うためのツールとして、Emacsというテキストエディタ上で動くESSというプログラムがあります。 ESS (Emacs Speaks Statistics) は Emacs や XEmacs から R などの統計解析アプリケーションを便利に使ってしまおう,という Lisp プログラムです.(http://www.okada.jp.org/RWiki/index.php?ESS) 特にWindowsではRに付属してくるRguiの機能がやや貧弱で、Rを快適に使えるとは言い難い部分があります。ESS

  • Incanter: Statistical Computing and Graphics Environment for Clojure

    Incanter is a Clojure-based, R-like platform for statistical computing and graphics. Incanter can be used as a standalone, interactive data analysis environment or embedded within other analytics systems as a modular suite of libraries. Features Charting & visualization functions Mathematical functions Statistical functions Matrix & linear algebra functions Data manipulation functions Interactive,

  • 統計的自然言語処理エンジンStaKK - nokunoの日記

    統計的自然言語処理エンジンStaKK を開発しました。nokuno’s stakk at master - GitHub 以下、READMEからの引用です。 現在の機能 かな漢字変換 予測変換 または サジェスト スペル訂正 形態素解析 HTTPによるAPIサーバ Trieの直接操作現在は、StaKK は辞書として Mozc (Google日本語入力のOSS版)のデータを使っています。 リバースモードについてStaKK はノーマルモードとリバースモードの2つのモードを持っています。 ノーマルモードでは、かなを入力し、単語(主に漢字)を出力します。 リバースモードでは、単語を入力し、読みや品詞を出力します。これらの2つのモードの応用例をまとめると、次の表のようになります。 機能 ノーマルモード リバースモード Convert かな漢字変換 形態素解析 Predict 予測変換 検索ワードのサ

  • プログラミングのための確率統計 in Haskell

    こんな表のことを確率分布といいます。サイコロをふったときに起こるイベントの確率、たとえば「偶数の目が出る」確率を調べることは、この確率分布からこんな別の確率分布への変換だと考えられます。 この変換は、具体的にはこんな対応です。P(偶数) = P(2) + P(4) + P(6) P(奇数) = P(1) + P(3) + P(5)P(X)がイベントXに対する確率を表しているわけですが、Pを「イベントの集合から[0,1]区間の実数への関数」だとみなすこともできます。確率分布から確率分布への変換は、関数に対する演算でもあるわけです。確率分布を連想リストで表せば、高階関数や代数型を使って、この変換をモデル化できそうです。 以前、このアイデアをSchemeで試してみたことがありました。当時は、そもそも確率についての理解が今よりもいっそうあやしかったし、実装もちゃちでしたが、このアイデアが特別なもの

  • Hacking is believing@itoshi.tv - 最もタメになる「初心者用言語」はRです

    二階堂愛 (Itoshi NIKAIDO) が綴る Hacking is beliveing な日常_ 最もタメになる「初心者用言語」はRです 最もタメになる「初心者用言語」まとめ (リンクされた,THX) うっかりTwitterで乗りおくれた! 最もタメになる「初心者用言語」は R。ってもう誰か書いた?とかつぶやいたら, @dritoshi 書いて!って言われたので,ムリがあるけど俺,がんばった. R Lispを父にSを母に持つ統計解析言語 筋は悪くないよ.CLOSから取り入れた総称的関数が大活躍だし.なのにカッコカッコしてない! もちろんオブジェクト指向プログラミングもできるしユニットテストもあるよ.統計言語だからデータ構造も豊富! ガベコレもあるよ.無名関数もあるよ.例外処理,遅延評価,関数クロージャ,再帰もできるし,自在にベクトル計算ができるから複雑なループを作らなくてもいいよ.

  • 機械学習 はじめよう 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    機械学習 はじめよう 記事一覧 | gihyo.jp
  • ナイーブベイズを用いたブログ記事の自動分類 - 人工知能に関する断創録

    カイ二乗値を用いた特徴選択(2010/6/25)の続きです。今まで使ってきた20 Newsgroupsというデータは英語文書でかつ元ネタがよく分からずあまり面白くなかったので、今回はこのブログ(人工知能に関する断想録)の記事を分類してみます。このブログの各記事には私の判断でカテゴリをつけています。たとえば、この記事は[機械学習][自然言語処理]です。カテゴリのリストはこのブログの左メニューにあります。この前、少し整理したので全部で18のカテゴリがあります。新しい記事を書いたとき自動でカテゴリを割り振ることはできるのでしょうか? (注)プログラミング言語はPythonを使っています。シリーズもので以前作ったコードを再利用してるので検索で飛んできた人はナイーブベイズを用いたテキスト分類(2010/6/13)から順に読んでください。 はてなダイアリーデータのダウンロードと整形 まず、はてなダイア

    ナイーブベイズを用いたブログ記事の自動分類 - 人工知能に関する断創録
  • Muliaslot88 | 8 Cara Menang Besar dengan Situs Judi Slot Terbaik dan Terpercaya no 1 di Indonesia

    Kami tahu bahwa slot online menarik, menyenangkan, dan dapat meningkatkan peluang Anda untuk memenangkan banyak uang. Tetapi dengan begitu banyak pilihan di luar sana, bagaimana Anda tahu mana yang harus dipilih? Jika Anda ingin mencapai kesuksesan di industri judi slot, Situs Judi Slot Terbaik dan Terpercaya Nomor 1 di Indonesia adalah pilihan terbaik Anda. Situs ini telah memperoleh reputasi yan

    jjzak
    jjzak 2011/02/20
    テキストマイニング
  • 環境と品質のためのデータサイエンス

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • ガウス関数

    このページでは、あらゆる物理量の基となる正規分布:ガウス関数について説明します。このページの知識を用いると、電子の状態密度図を書いたり、p-DOSを書いたり、吸収スペクトルの位置の分布に幅をつけたりすることが出来ます。 ●例  を  に変換する。 (グラフの縦横比のずれは、質的ではありません)。 ●ガウス関数の基礎 例えば、ある学校(生徒数約750人)のテストの成績が、次のような グラフで表されるとします(満点が100点で平均点が50点)。 このとき、x = 0からx = 100の範囲でこのグラフで囲まれた部分の面積が 750となります。 一般に、自然界で起こるあらゆる現象は、このような曲線で表されると 言われています。この曲線を正規分布、またはガウス関数と呼んでいます。 ガウス関数の一般式は、次のようになっています。 このグラフで囲まれた面

  • Data Sorcery with Clojure

    Although there were not many updates to the blog in the last years, Incanter’s development still happens with contribution of many people. As result of this, I just pushed 1.9.3 release to Clojars.  This release includes several fixes in the charts library, makes Incanter completely compatible with 1.9.0 (Incanter itself still lists 1.8.0 as dependency), plus some other fixes, listed at changelog.

    Data Sorcery with Clojure
  • EMアルゴリズムによるスペル訂正エンジン - nokunoの日記

    以下の論文が面白かったので紹介したいと思います。Learning a Spelling Error Model from Search Query Logs Noisy Channel Modelによるスペル訂正エンジンスペル訂正には標準的なNoisy Channel Modelを使うことができます(最近は識別モデルも流行りのようです)。A Spelling Correction Program Based on a Noisy Channel ModelNoisy Channel Modelでは、入力が与えられたときの訂正候補の確率を以下のようにモデル化します。言語モデル はコーパスやクエリログから単語N-gram、文字N-gramなどを推定し、スムージングして利用することが一般的です。エラーモデル は入力と出力候補の編集距離をもとに計算することが多いです(他に共起頻度やクリックログを利

  • Commons-Math

    Math Overview Downloads Latest API docs (development) Javadoc (4.0-beta1 release) Javadoc (3.6.1 release) Issue Tracking Source Repository (current) Wiki Developers Guide Proposal User Guide Contents Overview Statistics Data Generation Linear Algebra Numerical Analysis Special Functions Utilities Complex Numbers Distributions Fractions Transform Methods Geometry Optimization Curve Fitting Least Sq

  • http://www.eto.titech.ac.jp/contents/sub10/index.html

  • 東京工業大学 工学入門講座 オンライン版 - 科目一覧

    差分法の入門的な部分から始まり、流体方程式の基礎となる移流方程式、拡散方程式を差分法で解く手法を学ぶ。安定性解析により、数値的に発散しないための条件を理解することができる。非線形方程式であるBurgers方程式やPoisson方程式も含めて、これらの1次元方程式を解く Java のアプレットを実行することで数値計算をインタラクティブに実行することができる。 流体工学で最もよく現れる非圧縮性流体をシミュレーションするために、基礎編で学んだ方程式を2次元計算する手法を学ぶ。各章にC言語プログラムと Java アプレットが用意されていて、パラメータを変えて実行するなどが可能である。Linuxの X-Window環境があれば、C言語プログラムを実行し、よりプログラムの詳細を理解することができる。最終章の物体周りの流れの計算では、物体を任意に置くことにより、カルマン渦列を始め、さまざまな流れをインタ

  • 多変量解析

    データの中には、多くのトレンド(傾向)が必ず隠れています。このトレンドをつかむことができるのならば優位に意思決定を進めることができます。 このページでは、データの中からトレンドを見つける多変量解析の手法を紹介します。 ことわざで「木を見て森を見ず(You can't see the forest wood for the trees. )」といわれるように、データマイニングの分野ではマクロ(巨視的)な視点で全体を捉える能力が求められます。 とはいえ、データの要素数が多くなると全体像を捕らえることが困難になるのです。 コンピュータは局所的な数値の集合として全体を把握していますので、意味ある情報として全体を見ることが不得意です。逆に人間には、もともと空間的に全体像を捉える能力が超越しています。 例をあげて解説します。 左図は写真です。写真も「画素」と呼ばれる一つ一つの情報の集まりで全

  • 海外のRの情報源 - yasuhisa's blog

    Tokyo.Rに参加してきて、色んな人とお話させてもらったけど、結構Rを使いこなしているなぁと思う人が多いというのが第一印象だった(やってる内容とか悩んでいる問題とか)。が、悩んでいる問題を解決する術がすでに存在しているにも関わらず英語なので、その人たちに情報が伝わってないっていうのが結構あるなぁというのを感じた。日語で誰かがBlogとかでキャッチアップするとしても結構タイムラグがあるし、(最近多くのが出ているとは言え)になるのを待っていたら数年単位でしか情報を得ることができない。というわけで結論としては「英語のリソース読め!!!」ってことになるんだけど、自分も最初はどこ読めばいいかとかよく分からなかったなぁと思ったので、自分が読んでる英語で書かれているRの情報源になっているところを列挙していこうと思います。 僕はIRCとかは使ってないので、その付近はよく分からないのと他にもまだまだ

    海外のRの情報源 - yasuhisa's blog
  • Home · incanter/incanter Wiki · GitHub

    Dismiss Join GitHub today GitHub is home to over 28 million developers working together to host and review code, manage projects, and build software together. Sign up Overview Getting started with Clojure Getting started with Incanter Documentation and examples Building Incanter Dependencies Overview and motivation Incanter is a Clojure-based, R-like statistical computing and graphics environment

    Home · incanter/incanter Wiki · GitHub
  • 統計手法チートシート

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    統計手法チートシート