タグ

researchとsearchに関するoverlastのブックマーク (6)

  • partake.in

    This domain may be for sale!

    partake.in
    overlast
    overlast 2014/10/01
    10/11(土) 12:30〜 渋谷のデンソーアイティラボラトリさんで開催。招待講演は小町守さん(@mamoruk)。
  • 話題のwat-arrayを使ってBurrows-Wheeler変換(BWT)してみた - EchizenBlog-Zwei

    先日PFIの岡野原氏によってwat-arrayというライブラリが公開された。 wat-array : wavelet木を利用した高速配列処理ライブラリ : Preferred Research Blog このライブラリは内部でウェーブレット木(wavelet tree)という簡潔データ構造(succinct data structure)を使っている。このため文字列に対するrank()やselect()などの操作が効率的にできるようになっている。 ・・・といっても馴染みのない人にとっては何が嬉しいのかピンと来ないかもしれない。そこでBurrows-Wheeler変換(BWT, Burrows-Wheeler Transform)を例にとってwat-arrayの使いみちを説明してみる。 Burrows-Wheeler変換というのはテキストを同じ文字が並びやすいように変換したもので、通常ランレ

    話題のwat-arrayを使ってBurrows-Wheeler変換(BWT)してみた - EchizenBlog-Zwei
  • wat-arrayでラクラク実装☆FM-Indexの作り方 - EchizenBlog-Zwei

    というわけで大変便利なライブラリwat-arrayを使ってFM-Indexを簡単に実装してみるよ。格的なライブラリは既にFM-Index++という良いものがあるので、記事では仕組みの解説を目的とする。 参考資料: FM-index++を公開しました - tb_yasuの日記 An alphabet-friendly FM-index (P. Ferragina, G. Manzini, V. Makinen, G. Navarro, 2004) なお、記事では前回の記事で実装した(ってほどでもないけど)text2bwt()とLF()を使っている。 話題のwat-arrayを使ってBurrows-Wheeler変換(BWT)してみた - EchizenBlog-Zwei 今回もテキストとしてmississippi#を使う。まずテキストから任意のキーの出現回数を得る関数get_rows(

    wat-arrayでラクラク実装☆FM-Indexの作り方 - EchizenBlog-Zwei
  • ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得 - 武蔵野日記

    5月21-22日に開催される情報処理学会第191回自然言語処理研究会報告の発表原稿 PDF。 小町守, 牧慎平 (Yahoo!), 内海慶 (Yahoo!), 颯々野学 (Yahoo!). ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得. 情報処理学会第191回自然言語処理研究会. Vol.2009-NL-191, No.9, May 2009. 情報処理学会の bookpark から先週木曜日にダウンロードできるようになったようだが、数カ所式に誤りがある(〆切以降一切修正できない模様)ので、参照される方はこちらを参照されたく。実際の発表前にそんな読む人はいないだろうと思ってのんびりしていたのだが、bookpark 公開バージョンをすでに読まれた方もいるみたいで、みなさまにはご迷惑をおかけしている次第であるが……。ちなみに電子化されたせいかどうか分からないが、ページ数が分からない

    ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得 - 武蔵野日記
  • 「Introduction to Information Retrieval」の輪講始めます

    「Introduction to Information Retrieval」の輪講始めます 2007-12-03-2 [IIR] 「Introduction to Information Retrieval」というがあります。 まだ出版されていないのですがドラフト PDF が入手できます。 - Introduction to Information Retrieval http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html - 言及記事→[2007-01-23-5] 来年1月から、有志でこのの輪講を行います。 基的に私が全体をフォローしますので、 まあ「たつをゼミ」みたいな感じです(ヲゼミ?)。 大学のゼミみたいのをオープンにやるイメージで。 第一回は、 2008年1月12日(土)の12:00-15

    「Introduction to Information Retrieval」の輪講始めます
  • 検索エンジンの表示結果、最初のページしか見ないユーザーは62% (MYCOM PC WEB)

    米iProspectは、検索エンジンの最新利用事情などを調査したレポート「iProspect Search Engine User Behavior Study」の発表を行った。検索結果の上位に表示されることの重要性が浮き彫りにされている。 同レポートは、米調査会社のJupiterResearchが、米国内の検索エンジンユーザーを対象にして実施した調査に基づくとされる。調査結果によれば、最初のページに表示された検索結果のリンクをクリックするようにしているとの回答者が、全体の62%を占めた。もしも最初のページで探していた情報が見つからなければ、2ページ目以降に表示された検索結果を見ることなく、検索語や検索エンジンを変更して、新たなサーチを行うようにしているとの回答も、全体の41%に上ったという。いずれの回答も、4年前に実施された同種の調査結果と比較して、10ポイント以上は上昇しているとされ

  • 1