タグ

概要に関するni66lingのブックマーク (7)

  • 『言語処理を支える基盤技術』

    引き続き私の専門の話だが,この手の話をあまり詳しくしても, 多くの人にとっては全く関心が持てないだろうから,今回は極めてざっくりとした話をしよう. 現在の自然言語処理(NLP)の基礎技術は基的に機械学習Machine Learning)を利用することが普通になっている.例えばスパムメールフィルタを考えると分かりやすい. 最初はうまくフィルタできず,見逃しやら,正しいメールをスパムと判定したりする. それを,正解と不正解とをいくつも与えて,何度も繰り返すと,段々うまくスパムメールだけを振り分けられるようになってくる. 具体的な手法は,SVM,ロジスティック回帰,パーセプトロンなど,まあ色々ある. 実際Gmailなどはこれによりかなりの精度でメールフィルタリングを実現している. 言語処理ではこのような自動分類技術が一般的に使われる. では,この技術を使って,Webなどから抽出した生のテキス

    『言語処理を支える基盤技術』
  • PRML 読書会 #13 10章 近似推論法(変分ベイズ) - 木曜不足

    参考:「機械学習とパターン認識」(PRML)のアンチョコ by herumi PRML 9章や10章の数式の解説ノート。10章の大変な計算も丁寧に展開してある。 4/10 の C.M.ビショップ「パターン認識と機械学習(PRML)」読書会 #13@サイボウズ・ラボ に参加しました。各位お疲れ様でした。 今回のテーマは10章の変分推論(変分ベイズ)。監訳者のしましま先生からも「PRMLで最も恐ろしいところ」とお墨付きをもらっているほどの鬼計算の章。 10.2.1 の混合ガウス分布を変分ベイズで推論する例のところを担当した。 発表資料 10.2-10.2.1 例:変分混合ガウス分布、資料後半 by id:n_shuyo 10.2.2-10.2.5 変分下限*1〜導出された分解 by wk さん 10.3 変分線形回帰 by id:tsubosaka さん 10.4-10.5 指数型分布族〜局

    PRML 読書会 #13 10章 近似推論法(変分ベイズ) - 木曜不足
  • 全文検索エンジンgroongaを囲む夕べ 2: 「groonga村」と「mroongaのベンチマーク」用資料 - 2011-12-01 - ククログ

    今年も11月29日に「全文検索エンジンgroongaを囲む夕べ」が開催されました。1年ぶりの開催です。会場は株式会社VOYAGE GROUP(10月に株式会社ECナビから社名変更)でした。会場提供ありがとうございます!とても助かりました。会場提供にあたりこしばさんにとてもお世話になりました。ありがとうございます。 資料一覧: まとめ中 Ustreamの録画: グニャラくんさんがUstream係をやってくれました。ありがとうございます。 Twitter上での反応: とみたさんがまとめてくれいました。ありがとうございます。 29日なので、もちろん新しいバージョンのリリースも行われています。 groonga 1.2.8 mroonga 1.10 rroonga 1.3.0 ActiveGroonga 1.0.7 今年は、会の内容の概要を紹介する導入用のセッション「groonga村」と、mroon

    全文検索エンジンgroongaを囲む夕べ 2: 「groonga村」と「mroongaのベンチマーク」用資料 - 2011-12-01 - ククログ
  • モーショノロジー2012 #1: rroongaによる検索サービスの実装 - 2012-01-26 - ククログ

    注意: 長いです。 簡単まとめ: 検索サービスを作るにはrroongaが便利です。groongaサポートサービスをはじめます。 CROOZ株式会社が主催する「モーショノロジー2012 #1 全文検索&検索を利用したサービスの使命、利用プロダクト、事例紹介」が開催されました。今回のテーマは検索ということでgroonga開発チームに声をかけてもらいました。groonga関連の枠がいくつかあったのですが、ここではRubyとgroongaを使った検索サービスの作り方についての枠の内容を紹介します。 以下、多少省略しながらスライドの内容を紹介します。 概要 紹介する内容はrroongaを使った場合のメリット・デメリットと入力補完についてです。メリットは事例も交えながら紹介します。入力補完は「Ruby + groongaだからできる」という機能ではなくgroonga単体でも利用できる機能なのですが、最

    モーショノロジー2012 #1: rroongaによる検索サービスの実装 - 2012-01-26 - ククログ
  • とほほのperl入門 ◆ 正規表現

    Perlとは インストール 実行方法 引数指定 ファイル指定 自己完結型 標準入力読み込み型 基礎知識 簡単な実行例 これだけは覚えて strictモードと警告モード 関数の括弧 定数 数値 文字列 エスケープシーケンス(\) 数値と文字列 真(true)と偽(false) バイナリデータ 変数 変数宣言(my) スカラ($XXX) 配列(@XXX) ハッシュ(%XXX) 変数名に使える文字 定義済変数みと未定義変数 省略時の変数($_) 環境変数($ENV{'XXX'}) コマンド引数($ARGV) シグナル($SIG{'XXX'}) その他の特殊変数($X) 演算子 代入演算子 算術演算子 ビット演算子 数値比較演算子 文字列比較演算子 条件演算子 正規表現マッチング 文字列連結 文字列置換 繰り返し演算子 範囲演算子 ファイル検査 制御構文 if elsif else文 unless

  • 画像処理 #17 LOGフィルタ

    またまた画像処理ネタ. LOGフィルタ(Laplacian Of Gaussian Filter) LOGフィルタというものがあります. エッジの検出には,ラプラシアンフィルタを使ったりします.ラプラシアンフィルタは,2次微分と同様の働きをするため,値が+から-に変化する所(ゼロ交差=zero crossing)がエッジに相当します.しかし,2次微分であるためノイズが強調されます.だので,ガウシアンフィルタをかけ平滑化した後,ラプラシアンフィルタをしましょうというのがLOGフィルタです. 下がフィルタの式です. ちなみにグラフはこんな感じ. Fig.1 LOGフィルタのグラフ(σ=2) 下に例を… Fig.2 元画像 Fig.3 LOGフィルタ(σ=1) Fig.4 LOGフィルタ(σ=2) Fig.5 LOGフィルタ(σ=4) Fig.6 LOGフィルタ(σ=8) 左の画像は,フィルタ適

  • 1