タグ

2011年12月22日のブックマーク (13件)

  • 文字列の類似度を測る(1) レーベンシュタイン距離|Colorless Green Ideas

    ある文字列と別の文字列の類似度を測る手法の1つである、レーベンシュタイン距離について紹介する。文字列の類似度は検索エンジンやDNAの塩基配列の調査などにも使用されており、応用範囲は広い。 はじめに Googleの検索結果の訂正候補 検索サイトで検索語を間違えて入力してしまった場合、検索エンジンが訂正候補を出してくれることがある。図に掲げた例では、「マクドナルド」と入力しようとして、誤って「マクラナルド」と入力してしまっているが、Google は「マクドナルド」の検索結果を返している。誤ったものを入力すると、その誤ったものと似た正しいものを返しているのである。 このように訂正候補を出すには、まず入力されたものと似ているものを探し出すということが必要になる [1] 。そして、似ているものを探し出すには、何をもって似ているとするのかということを決めなくてはならない。つまり、類似度の尺度が必要とな

  • 話題の新技術、簡潔データ構造の入門用資料をまとめてみた - EchizenBlog-Zwei

    最近私の周辺で簡潔データ構造に興味を持つ人が増えてきた。簡潔データ構造といえばGoogle日本語入力でも使われている話題の新技術。自然言語処理界隈で機械学習の次にブームになるのはこれだ!と個人的に思っている。 というわけで入門用の資料をまとめてみた。 簡潔データ構造では、すべての基礎である簡潔ビットベクトルがあって、その上に応用として簡潔木(LOUDSなど。Google日本語入力で利用されている)、簡潔文字列(ウェーブレット木など。FM-Indexに利用されている)がある。最近ではこれらより複雑なデータ構造に対する簡潔構造も研究されている。 ということをふまえて以下の資料を読むと良い。 Efficient dictionary and language model compression for input method editors Taku Kudo et al. Google

    話題の新技術、簡潔データ構造の入門用資料をまとめてみた - EchizenBlog-Zwei
  • overlasting.net

    overlasting.net 2019 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

  • overlasting.net

    overlasting.net 2019 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

  • Support Vector Machine

    最近よく巷で耳にするモノ. SVM, Support Vector Machine, さぽーとべくたーましん. これっていったい,どんなもんなんでしょう. なにやら便利そうなモノらしいので,ちょいと調べて要点をまとめてみようかな,なんて. でも,ただまとめただけだとそのへんの記事を読むのとなんにも変わらないので, コーディングするために必要な知識を中心にまとめてみることにします.

    hirokist
    hirokist 2011/12/22
    SVMを図入りでわかりやすく解説
  • BLOG::broomie.net: 機械学習・自然言語処理のリソースリンク集

    いつもネット上で機械学習NLPに関する便利そうなツールや,有用なドキュメント,動画,ツールなどをメモしているのですが,今後の調査のためにどこかに一つに集約しておきたいなあ,と思い,この記事に集約しておくことにしました.昨今,自動リンク集や,自動インデックス作成に関して研究が盛んにされていますが,これは人力リンク集です!リンク先はほとんどさらっとしか見ていないので当に有用かどうか保証できませんが,興味を持ったものは掘り下げて別の記事で紹介したいと思います.おもしろいものを見つけしだい,このエントリーは更新していきたいと思います. ※ 有名どころをカバーしているわけではありません,あくまで気まぐれで追加していきます... ※ いくつかカテゴリ間で重複します 解説・読み物系リソース 全般 Statistical Data Mining Tutorials Tutorial Slides by

  • NLTK導入メモ

    数学,プログラミングといった技術に関するブログ. 主なトピックはR,Java,C,競技プログラミングです. WebページはFirefoxで表示を確認しています。 TopCoder ID:itoyan slideshare ID(勉強会で発表に利用したスライド):itoyan110 github ID:itoyan Windows上でPythonを利用してNLTK(Natural Language ToolKitの略)を動作させるために行うべき手順についての覚書。NLTKというのは、自然言語処理のためのライブラリです。 Pythonのインストール バージョンは2.xを用いるようにしましょう。NLTKは3.x系に対応しているという情報は公式サイトにはありませんでした。ダウンロード先はこちら(Python Japan User's Group)から2.6.6のインストーラを使うことにしましょう

    NLTK導入メモ
    hirokist
    hirokist 2011/12/22
    nltkの導入
  • R 入門

    Rとは? R は統計計算とグラフィックスのためのフリーソフト(GNU-style copyleft)である。 Rは商用ソフトのS(AT&T ベル研究所のRichard A. Becker, John M. Chambers, and Allan R. Wilks により作られた統計解析やグラフィックスのための言語であり、製品としては S version 4 や S-Plusがある)に操作環境などが良く似ており、Sを使っている場合には関数の利用法がほぼ同じことから取っつきやすく、Sで定義した関数などはRでもほとんど変更なしに動作する。 Sの現在のバージョンほどは新たな手法やグラフ表示法は取り入れられていないが、通常の解析ならば不都合は感じないだろう。 CRAN(The Comprehensive R Archive Network)にはRに対する追加パッケージも沢山あり、新たな手法は、これら

    hirokist
    hirokist 2011/12/22
  • R - 統計解析とグラフィックスの環境

    今回のアクセスは 回目 です。 (Since June 26, 2001) version 2.13.1 がリリースされました CRAN のWebサイト http://www.r-project.org/ で最新 情報を入手できます。 Rとは? R は統計計算とグラフィックスのためのフリーソフト(GNU-style copyleft)です. RはSに操作環境などが良く似ており, Sで動作するものはRでもほとんど変更なしに動作します. R はSのクローンのフリーウェアと捉えられがち(私もそう思っていた)ですが, 全くのクローンではなく(もちろん完全なクローンを目指しているわけでもありません),内部的な構成などはSとは全く違います. 詳細は R FAQの 3.3 What are the differences between R and S? を参照して下さい. S は AT & T ベル研

    hirokist
    hirokist 2011/12/22
  • Index of /Uploads Elad Yom-Tov's homepage

    Index of /Uploads NameLast modifiedSizeDescription Parent Directory   - Ada_Boost.m 2008-11-17 13:06 3.1K Bottom_Up_Parsing.m 2008-11-17 13:06 2.2K C4_5.m 2008-11-17 13:06 6.7K DHSchapter2_fixed.mat 2008-11-17 13:06 598 Grammatical_Inference.m2008-11-17 13:06 4.2K Marginalization.m 2008-11-17 13:06 1.9K PPT.m 2008-11-17 13:06 1.8K SVM.m 2008-11-17 13:06 7.8K Sequential_Feature_S..>2008-11-17 13:06

    hirokist
    hirokist 2011/12/22
    metlab用の機械学習のプログラム
  • Redirecting...

    If you are not redirected, click here.

    hirokist
    hirokist 2011/12/22
    機械学習の論文が読めるサイト
  • Photoshopのキラーチュートリアル30個

    Photoshopはあらゆるところで使われており、だからこそ山のように使い方を解説したチュートリアルがあるわけですが、その中でも特に「これは!」と思われるようなキラーチュートリアル30個です。 30 Killer Free Photoshop Tutorials http://slodive.com/photoshop/free-photoshop-tutorials/ ◆1:ダーク・フォト・マニピュレーション「ヴァンパイアハンター」(光と影をうまく操作するためのレタッチ・カラー調整・レイヤーの操作が分かる) ◆2:魅力的なオウムの写真操作(動物の写真を抽象的かつインパクトのある画像に加工するレイヤー操作方法) ◆3:Photoshopで手描き風イラスト ◆4:雰囲気のある風景に加工する(レイヤーとテクスチャを駆使してそれっぽくする) ◆5:水であふれて見るものを不安にさせるシーン作り(2

    Photoshopのキラーチュートリアル30個
  • コンプリート・シャーロック・ホームズ

    名探偵の代名詞、シャーロック・ホームズ。 全作品を合計すると60作品(長編4、短編56)にもなります。 文庫にして9~10冊ですから、全部読み切るのはなかなか大変です。 原作の著作権はすでに切れていますので、英語のテキストは数多くのサイトで公開されていますが、 邦訳はほとんど著作権が残っており、インターネット上で自由に読める邦訳はごく一部に過ぎません。 このサイトでは、既存の著作権に抵触しないように、全ての作品を改めて原作から翻訳し直して公開しています。 初出誌のストランドマガジンに掲載されたシドニー・パジェットのイラストも、ほぼすべて掲載してありますので、パソコンや携帯から、存分に世紀の名探偵シャーロック・ホームズの魅力をお楽しみください。 Tweet

    コンプリート・シャーロック・ホームズ