さらに詳細な利用方法が知りたい方は、Yahoo!デベロッパーズネットワークのマニュアルを参照してください。 ベイジアンフィルタの実装 ここから本格的にベイジアンフィルタの実装に入っていきます。 その前に、まずは先程のリスト1のコードを利用して入力された文章をわかち書きし、単語の集合を返す関数を作成しnaivebayes.pyとして保存しましょう。こちらも先程のmorphological.pyと同様にutf-8で保存してください。 リスト2 文章の分割をする関数(naivebayes.py) # -*- coding: utf-8 -*- import math import sys #yahoo!形態素解析 import morphological def getwords(doc): words = [s.lower() for s in morphological.split(doc)
サンプルコードを動かして統計の直観的な理解を促した『Think Stats ―プログラマのための統計入門』の著者によるベイズ統計・ベイズ推論の解説書です。ベイズ統計は、不確実な問題を扱い、条件を付けた予測が必要なときに威力を発揮する統計手法の1つ。メールのフィルタやカーナビで使われていることは有名です。本書は『Think Stats』と同様、数学的な観点での記述は最小限にとどめ、実例を多く使って実用的観点からベイズ手法を解説します。Pythonで書かれたサンプルコードを使って実際に手を動かしながらベイズ統計を学ぶことができますが、プログラミングを知らない人にも役立つ内容です。 目次 まえがき 1章 ベイズの定理 1.1 条件付き確率 1.2 結合確率 1.3 クッキー問題 1.4 ベイズの定理 1.5 通時的解釈 1.6 M&M'S問題 1.7 モンティ・ホール問題 1.8 議論 2章 計
Yoshihiro Sato @yoshisatose 最近、TLで偽陽性の話題を目にするので、一つ練習問題を紹介します。これは昨秋、私が担当している統計学(1年生向け)の試験で出題した問題で、あとで複数の学生から「とても面白い問題だった」という反応がありました。「ベイズの定理」の問題なので、分かる人には簡単です。四則演算で解けます。 Yoshihiro Sato @yoshisatose 【問題】 人口の5%がある病気に罹っているとします。この病気に罹っているかどうかを確かめる検査があるのですが完全なものではなく、病気に実際に罹っている人が受けると90%の確率で陽性となり、病気に罹っていない人が受けると90%の確率で陰性と出ます。(続く…)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く