タグ

概要に関するni66lingのブックマーク (6)

  • 『言語処理を支える基盤技術』

    引き続き私の専門の話だが,この手の話をあまり詳しくしても, 多くの人にとっては全く関心が持てないだろうから,今回は極めてざっくりとした話をしよう. 現在の自然言語処理(NLP)の基礎技術は基的に機械学習Machine Learning)を利用することが普通になっている.例えばスパムメールフィルタを考えると分かりやすい. 最初はうまくフィルタできず,見逃しやら,正しいメールをスパムと判定したりする. それを,正解と不正解とをいくつも与えて,何度も繰り返すと,段々うまくスパムメールだけを振り分けられるようになってくる. 具体的な手法は,SVM,ロジスティック回帰,パーセプトロンなど,まあ色々ある. 実際Gmailなどはこれによりかなりの精度でメールフィルタリングを実現している. 言語処理ではこのような自動分類技術が一般的に使われる. では,この技術を使って,Webなどから抽出した生のテキス

    『言語処理を支える基盤技術』
  • PRML 読書会 #13 10章 近似推論法(変分ベイズ) - 木曜不足

    参考:「機械学習とパターン認識」(PRML)のアンチョコ by herumi PRML 9章や10章の数式の解説ノート。10章の大変な計算も丁寧に展開してある。 4/10 の C.M.ビショップ「パターン認識と機械学習(PRML)」読書会 #13@サイボウズ・ラボ に参加しました。各位お疲れ様でした。 今回のテーマは10章の変分推論(変分ベイズ)。監訳者のしましま先生からも「PRMLで最も恐ろしいところ」とお墨付きをもらっているほどの鬼計算の章。 10.2.1 の混合ガウス分布を変分ベイズで推論する例のところを担当した。 発表資料 10.2-10.2.1 例:変分混合ガウス分布、資料後半 by id:n_shuyo 10.2.2-10.2.5 変分下限*1〜導出された分解 by wk さん 10.3 変分線形回帰 by id:tsubosaka さん 10.4-10.5 指数型分布族〜局

    PRML 読書会 #13 10章 近似推論法(変分ベイズ) - 木曜不足
  • 全文検索エンジンgroongaを囲む夕べ 2: 「groonga村」と「mroongaのベンチマーク」用資料 - 2011-12-01 - ククログ

    今年も11月29日に「全文検索エンジンgroongaを囲む夕べ」が開催されました。1年ぶりの開催です。会場は株式会社VOYAGE GROUP(10月に株式会社ECナビから社名変更)でした。会場提供ありがとうございます!とても助かりました。会場提供にあたりこしばさんにとてもお世話になりました。ありがとうございます。 資料一覧: まとめ中 Ustreamの録画: グニャラくんさんがUstream係をやってくれました。ありがとうございます。 Twitter上での反応: とみたさんがまとめてくれいました。ありがとうございます。 29日なので、もちろん新しいバージョンのリリースも行われています。 groonga 1.2.8 mroonga 1.10 rroonga 1.3.0 ActiveGroonga 1.0.7 今年は、会の内容の概要を紹介する導入用のセッション「groonga村」と、mroon

    全文検索エンジンgroongaを囲む夕べ 2: 「groonga村」と「mroongaのベンチマーク」用資料 - 2011-12-01 - ククログ
  • モーショノロジー2012 #1: rroongaによる検索サービスの実装 - 2012-01-26 - ククログ

    注意: 長いです。 簡単まとめ: 検索サービスを作るにはrroongaが便利です。groongaサポートサービスをはじめます。 CROOZ株式会社が主催する「モーショノロジー2012 #1 全文検索&検索を利用したサービスの使命、利用プロダクト、事例紹介」が開催されました。今回のテーマは検索ということでgroonga開発チームに声をかけてもらいました。groonga関連の枠がいくつかあったのですが、ここではRubyとgroongaを使った検索サービスの作り方についての枠の内容を紹介します。 以下、多少省略しながらスライドの内容を紹介します。 概要 紹介する内容はrroongaを使った場合のメリット・デメリットと入力補完についてです。メリットは事例も交えながら紹介します。入力補完は「Ruby + groongaだからできる」という機能ではなくgroonga単体でも利用できる機能なのですが、最

    モーショノロジー2012 #1: rroongaによる検索サービスの実装 - 2012-01-26 - ククログ
  • とほほのperl入門 ◆ 正規表現

    ラリー・ウォール氏によって1987年に開発されたスクリプト言語です。 C言語、AWK、sed, sh などの影響を受けて開発され、PHP, Ruby, Python などに影響を与えました。 聖書の中の「高度な真珠」にちなんで pearl と名付けられる予定でしたが、同盟の言語がすでに存在したため Perl と名づけられました。 現在では Perl は "Practical Extraction and Report Language" の略とされています。 プログラミング言語を示すときは先頭大文字で「Perl」、処理系を表すときは先頭小文字で「perl」と表します。 2023年9月現在、5.38 が最新版です。 RHEL7系では 5.16、RHEL8系では 5.26、RHEL9系では 5.32、Ubuntu 22.04では 5.34 がインストールされます。 Windows用の実装として

  • 画像処理 #17 LOGフィルタ

    またまた画像処理ネタ. LOGフィルタ(Laplacian Of Gaussian Filter) LOGフィルタというものがあります. エッジの検出には,ラプラシアンフィルタを使ったりします.ラプラシアンフィルタは,2次微分と同様の働きをするため,値が+から-に変化する所(ゼロ交差=zero crossing)がエッジに相当します.しかし,2次微分であるためノイズが強調されます.だので,ガウシアンフィルタをかけ平滑化した後,ラプラシアンフィルタをしましょうというのがLOGフィルタです. 下がフィルタの式です. ちなみにグラフはこんな感じ. Fig.1 LOGフィルタのグラフ(σ=2) 下に例を… Fig.2 元画像 Fig.3 LOGフィルタ(σ=1) Fig.4 LOGフィルタ(σ=2) Fig.5 LOGフィルタ(σ=4) Fig.6 LOGフィルタ(σ=8) 左の画像は,フィルタ適

  • 1