サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大谷翔平
www.yakupro.info
以前薬歴文書の分類にナイーブベイズ分類器を使いました。この分類器は迷惑メールのフィルタやWebニュース記事の分類等で使用されているそうです。特徴として、性能はやや劣ることがあるものの、高速に訓練でき実装も比較的容易だということで、今回はこのナイーブベイズのアルゴリズムを自分で実装してみました。 ベイズの定理で条件付き確率を求める ナイーブベイズのアルゴリズム P(cat) P(doc|cat) ゼロ頻度問題 アンダーフロー対策 ナイーブベイズを実装する 推定カテゴリのスコア つまづいたところ まとめ 参考 ベイズの定理で条件付き確率を求める 「事象Bという条件下で事象Aが起こる確率」である条件付き確率は次の式で表せます。 この式を書き換えると、 は「事象AとBの両方が起こる確率」を表しますが、とも表せるので、上の式は以下のように書き換えられます。 これらの関係から、ベイズの定理と呼ばれる次
文書データを数値表現に変換する手法の1つであるBag of Wordsを一からPythonで書いてみました。 Bag of Words(BoW)とは BoWの問題点 nグラムによるBoW sklearnのCountVectorizerのパラメータについて tokenizer preprocessor analyzer stop_words max_dfとmin_df BoWを自分で書いてみる 参考 Bag of Words(BoW)とは 単語が含まれているかどうかだけを考え、語順は考慮せずに文書をベクトル(数値表現)に変換する方法です。このベクトル化により、文書データを機械学習アルゴリズムで使用できるようになります。 「ベクトル化」と聞いたときは最初ちょっと身構えてしまいましたが、このやり方自体はそれほど難しいものではありませんでした。 そのやり方とはこのようなものです。 A = "副作用
コピー機等でスキャンした画像データをよく見ると、ほんのわずかに傾いているものがあります。Windowsだと標準ソフトのフォトあたりを使うと、スライダーをマウスで動かしながら画像の回転を行うことができますが、角度の最小単位が1度ずつとなっていて微妙な操作は難しそうですし、何十枚もこの作業をするのは面倒です。そこで、今回は画像の傾きを自動で補正するプログラムを書くことにしました。 なお、本記事の内容は「数字認識を使って棚卸を自動化するアプリケーションを作る」で行った処理のひとつとなっています。 補正の目的と方法 環境 OpenCVのインストール テンプレートマッチングによるマーカーの位置の検出 テンプレート画像の作成 OpenCVによるテンプレートマッチング 補正する回転角度を求める 画像の回転処理 プログラムの動作を確認する 写真で試してみる 参考 補正の目的と方法 ・目的 Excelで作成
このページを最初にブックマークしてみませんか?
『www.yakupro.info』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く