[B! 概要] ni66lingのブックマーク

『言語処理を支える基盤技術』

引き続き私の専門の話だが，この手の話をあまり詳しくしても，多くの人にとっては全く関心が持てないだろうから，今回は極めてざっくりとした話をしよう．現在の自然言語処理（ＮＬＰ）の基礎技術は基本的に機械学習（Machine Learning)を利用することが普通になっている．例えばスパムメールフィルタを考えると分かりやすい．最初はうまくフィルタできず，見逃しやら，正しいメールをスパムと判定したりする．それを，正解と不正解とをいくつも与えて，何度も繰り返すと，段々うまくスパムメールだけを振り分けられるようになってくる．具体的な手法は，ＳＶＭ，ロジスティック回帰，パーセプトロンなど，まあ色々ある．実際Gmailなどはこれによりかなりの精度でメールフィルタリングを実現している．言語処理ではこのような自動分類技術が一般的に使われる．では，この技術を使って，Webなどから抽出した生のテキス

ni66ling 2014/12/21

リンク

PRML 読書会 #13 １０章近似推論法(変分ベイズ) - 木曜不足

参考：「機械学習とパターン認識」(PRML)のアンチョコ by herumi PRML 9章や10章の数式の解説ノート。10章の大変な計算も丁寧に展開してある。 4/10 の C.M.ビショップ「パターン認識と機械学習(PRML)」読書会 #13＠サイボウズ・ラボに参加しました。各位お疲れ様でした。今回のテーマは１０章の変分推論(変分ベイズ)。監訳者のしましま先生からも「PRML本で最も恐ろしいところ」とお墨付きをもらっているほどの鬼計算の章。 10.2.1 の混合ガウス分布を変分ベイズで推論する例のところを担当した。発表資料 10.2-10.2.1 例：変分混合ガウス分布、資料後半 by id:n_shuyo 10.2.2-10.2.5 変分下限*1〜導出された分解 by wk さん 10.3 変分線形回帰 by id:tsubosaka さん 10.4-10.5 指数型分布族〜局

ni66ling 2013/12/13

リンク

全文検索エンジンgroongaを囲む夕べ 2: 「groonga村」と「mroongaのベンチマーク」用資料 - 2011-12-01 - ククログ

今年も11月29日に「全文検索エンジンgroongaを囲む夕べ」が開催されました。1年ぶりの開催です。会場は株式会社VOYAGE GROUP（10月に株式会社ECナビから社名変更）でした。会場提供ありがとうございます！とても助かりました。会場提供にあたりこしばさんにとてもお世話になりました。ありがとうございます。資料一覧: まとめ中 Ustreamの録画: グニャラくんさんがUstream係をやってくれました。ありがとうございます。 Twitter上での反応: とみたさんがまとめてくれいました。ありがとうございます。 29日なので、もちろん新しいバージョンのリリースも行われています。 groonga 1.2.8 mroonga 1.10 rroonga 1.3.0 ActiveGroonga 1.0.7 今年は、会の内容の概要を紹介する導入用のセッション「groonga村」と、mroon

ni66ling 2013/10/31

リンク

モーショノロジー2012 #1: rroongaによる検索サービスの実装 - 2012-01-26 - ククログ

注意: 長いです。簡単まとめ: 検索サービスを作るにはrroongaが便利です。groongaサポートサービスをはじめます。 CROOZ株式会社が主催する「モーショノロジー2012 #1 全文検索&検索を利用したサービスの使命、利用プロダクト、事例紹介」が開催されました。今回のテーマは検索ということでgroonga開発チームに声をかけてもらいました。groonga関連の枠がいくつかあったのですが、ここではRubyとgroongaを使った検索サービスの作り方についての枠の内容を紹介します。以下、多少省略しながらスライドの内容を紹介します。概要紹介する内容はrroongaを使った場合のメリット・デメリットと入力補完についてです。メリットは事例も交えながら紹介します。入力補完は「Ruby + groongaだからできる」という機能ではなくgroonga単体でも利用できる機能なのですが、最

ni66ling 2013/10/31

リンク

とほほのperl入門 ◆ 正規表現

Perlとはインストール実行方法引数指定ファイル指定自己完結型標準入力読み込み型基礎知識簡単な実行例これだけは覚えて strictモードと警告モード関数の括弧定数数値文字列エスケープシーケンス(\) 数値と文字列真(true)と偽(false) バイナリデータ変数変数宣言(my) スカラ($XXX) 配列(@XXX) ハッシュ(%XXX) 変数名に使える文字定義済変数みと未定義変数省略時の変数($_) 環境変数($ENV{'XXX'}) コマンド引数($ARGV) シグナル($SIG{'XXX'}) その他の特殊変数($X) 演算子代入演算子算術演算子ビット演算子数値比較演算子文字列比較演算子条件演算子正規表現マッチング文字列連結文字列置換繰り返し演算子範囲演算子ファイル検査制御構文 if elsif else文 unless

ni66ling 2012/04/16

リンク

画像処理 #17 LOGフィルタ

またまた画像処理ネタ． LOGフィルタ(Laplacian Of Gaussian Filter) LOGフィルタというものがあります．エッジの検出には，ラプラシアンフィルタを使ったりします．ラプラシアンフィルタは，2次微分と同様の働きをするため，値が+から-に変化する所(ゼロ交差=zero crossing)がエッジに相当します．しかし，2次微分であるためノイズが強調されます．だので，ガウシアンフィルタをかけ平滑化した後，ラプラシアンフィルタをしましょうというのがLOGフィルタです．下がフィルタの式です．ちなみにグラフはこんな感じ． Fig.1 LOGフィルタのグラフ(σ=2) 下に例を… Fig.2 元画像 Fig.3 LOGフィルタ(σ=1) Fig.4 LOGフィルタ(σ=2) Fig.5 LOGフィルタ(σ=4) Fig.6 LOGフィルタ(σ=8) 左の画像は，フィルタ適

ni66ling 2011/09/28

リンク

はてなブックマーク

タグ

関連タグで絞り込む (15)

概要に関するni66lingのブックマーク (7)

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第2週）

今週のはてなブックマーク数ランキング（2025年4月第1週）

【復旧済】はてなブックマークへの接続ができない・不安定になる障害が発生していました

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス