タグ

2008年8月4日のブックマーク (3件)

  • エスキモーの創世記(9P) - so

    このブログ記事を参照しているブログ一覧: エスキモーの創世記(9P) このブログ記事に対するトラックバックURL: http://urban.sakura.ne.jp/mt/mt-tb.cgi/50

  • DO++: 機械学習による自然言語処理チュートリアル

    自然言語処理のときに使う機械学習手法のテクニックをざーっと2時間程度で紹介してほしいとのことだったので今日話してきました。基的に、そんなに頑張らなくても効果が大きいものを中心に説明(特にパーセプトロンとか)を説明してます。 紹介した手法はパーセプトロン、最大エントロピー、正則化、多クラス分類、系列分類(CRF, Structured Perceptron)などなどです。どれも一かじりする感じで網羅的に見る方を優先してます。個々の詳しい話はそれぞれの文献や実装などを当たってみてください。 スライド [ppt] [pdf] ここで話しているのは線形識別モデルの教師有り学習が中心で教師無し学習(クラスタリングなど)など他の自然言語処理を支える技術は省いてます。 こういうのを使って(使わなくてもいいけど)どんどんアプリケーション作らないといかんね。 Tarot is not used to ma

    DO++: 機械学習による自然言語処理チュートリアル
  • MOONGIFT: 社内向けの全文検索エンジン「どこかな?」:オープンソースを毎日紹介

    インターネットでは検索エンジンがごく普通に使われているが、意外なことにイントラネット上ではまだ検索エンジンはそれほど普及していない。原因としてはパブリックな情報だけを対象にするインターネット向けに比べて、権限周りなどの設定が複雑だということが挙げられる。 トップページ。シンプルな画面 だが、そうした権限を細かく指定しない前提であれば、使える全文検索エンジンは多数あるだろう。Web上の情報向けの全文検索エンジンとして、こちらを紹介しよう。 今回紹介するオープンソース・ソフトウェアはどこかな?、イントラネット向けの全文検索エンジンだ。 どこかな?は社内向けTwitterクローンである「しゃべる」の作者によるソフトウェアだ。TomcatやSeasar2などを使って開発されており、全文検索部分はLuceneによって実現されている。Windows向けにはインストーラーが、Linux向けにはパッケージ

    MOONGIFT: 社内向けの全文検索エンジン「どこかな?」:オープンソースを毎日紹介