タグ

2012年2月9日のブックマーク (8件)

  • 最近のSuffix Arrayによる全文検索について調べてみた - EchizenBlog-Zwei

    ちょっと興味があったので調べてみた。 全文検索には主に転置インデックス(Inverted Index)によるものと接尾辞配列(Suffix Array)/接尾辞木(Suffix Tree)によるものがある。 前者は効率的にデータを扱えるものの、キーワード単位でしかインデックスを付けられないので形態素解析するなどして検索対象のテキストからキーワードを取り出す必要がある。 後者は任意のクエリにマッチすることができるもののデータサイズが大きくなりがちであることと検索結果となる文書にスコア付けができないなどの問題がある。 最近ではSuffix Array/Treeによる全文検索に対して簡潔データ構造(Succinct Data Structure)を導入してデータサイズを小さくしたり、スコアをもたせる方法が提案されたりと何かと話題が多い。 Suffix Array/Treeが持つ文書検索の機能は、

    最近のSuffix Arrayによる全文検索について調べてみた - EchizenBlog-Zwei
  • Algorithm - Suffix Array を JavaScript で再発明してみた : 404 Blog Not Found

    2012年01月16日16:30 カテゴリアルゴリズム百選Lightweight Languages Algorithm - Suffix Array を JavaScript で再発明してみた WEB+DB 総集編 [Vol. 1〜60] もう10年以上前に某社のCTOだったころ、Suffix array(接尾辞配列)の解説を毎週の技術者ミーティングでしたら一名を除いて「ハァ?」状態だったことを思い出しつつ。 Suffix Arrayは何が画期的だったのか? 以下は、計算機科学者でなくても直感的に理解できると思います。 ソートされていない通常のデータの中にあるサブデータ(キー)を検索しようとすると、データの大きさに比例した時間(O(n))がかかる。 ソート済みのデータであれば、二分探索でデータの大きさの対数時間(O(logn))でキーを検索できる。 さらにキーからIDを定数時間で作成でき

    Algorithm - Suffix Array を JavaScript で再発明してみた : 404 Blog Not Found
  • 研究室に配属されたばかりのB4にそっと渡したい一冊‐それが「入門ソーシャルデータ」 - シリコンの谷のゾンビ

    オライリー・ジャパンさんから頂いた「入門ソーシャルデータ」を読みました. 入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック 作者: Matthew A. Russell,奥野陽(監訳),佐藤敏紀(監訳),瀬戸口光宏(監訳),原川浩一(監訳),水野貴明(監訳),長尾高弘出版社/メーカー: オライリージャパン発売日: 2011/11/26メディア: 大型購入: 18人 クリック: 779回この商品を含むブログ (42件) を見る ご紹介いただいた@overlastさん,オライリー・ジャパンさんどうもありがとうございます! 記念すべき人生初献.なんと監訳者全員が (IIR輪講などの勉強会を通じて) 知っている方だったのでびっくり. さて,遅ればせながら書のレビューを書きたいと思います.ただ,すでに著名なメンバーがレビューを書いていらっしゃるので,できるだけ観点がかぶらな

    研究室に配属されたばかりのB4にそっと渡したい一冊‐それが「入門ソーシャルデータ」 - シリコンの谷のゾンビ
  • 無料で見られるプログラミング関連書籍一覧 - YAMAGUCHI::weblog

    はじめに こんにちは、動画配信界の情弱です。年始からStackOverflow眺めてたら超絶便利な質問に神回答がされてたので忘れないうちにメモっておく。2012年どっかで役に立てばいいですね。 参考 オリジナルはこちら。ここではコメントにパラパラと載ってたので、まずは直近1ページ目だけにあったものを1個のリストにまとめてみた。ほぼGeorge Stocker氏による回答を載せただけだけど。あとちょっとだけ自分で和訳とか加えたので、知っているものがあればコメントに載せて下さい。追加します。まだDとかFactorとか載ってないし、Pythonも全然足りないし。 API Only - Stack Exchange もしかするとバージョンが古かったりするものもあるかも知れませんが、それもコメントで教えてもらえるとその旨追記します。 他にも過去に挙がったもののリンク ReadWriteWebのプログ

    無料で見られるプログラミング関連書籍一覧 - YAMAGUCHI::weblog
  • git - 簡単ガイド

    アッド & コミット 変更されたファイルを選択します。 git add <filename> git add * を実行するとIndexに追加されます。 これは基的な作業の一つです。 変更を実際に適用するには git commit -m "Commit message" を実行します。 変更がHEADに入りましたが、 リモートリポジトリには未だ入っていません。 変更のプッシュ この時点で、変更がローカルリポジトリのHEADに適用されました。この変更をリモートリポジトリに適用するには git push origin master を実行し、masterの代わりに適用のブランチ名を入れます。 もし既存リポジトリをクローンせずに使用した場合 git remote add origin <server> を実行すると、リモートリポジトリを登録する事が可能です。 これで変更を特定なリモートリポジト

  • Vim講座1 - think and error

    Vim講座3 - think and error テキストエディタであるvimはとても扱いやすいのだが、Vimてモード概念があって敷居が高い(誤用)よね。ということで少しだけ書いてみる。 viキー操作メモ(Hishidama's vi Memo) こんなサイトもあるわけなのだけど、これ不便。普段使わないものまで全て書いてあるからだ。 初心者にとっては、どこまで知ればミニマルなのかが知りたいというのに。 概要 モード概念 カーソル移動 インサートモードへ 保存 ////////////基礎終了//////////// ビジュアルモードとコピペ ジャンプ 置換 Undo,Redo[***IMPORTANT***] 一文字置換 こうやってみると長そうだね. モード概念 モードは4つ。ノーマルモード、インサートモード、ビジュアルモード、コマンドモード。 ノーマルモード 起動したときはこのモード。移

    Vim講座1 - think and error
    hirokist
    hirokist 2012/02/09
  • viキー操作メモ(Hishidama's vi Memo)

    S-JIS[2003-05-19/2007-01-16] 変更履歴viエディター操作 UNIXでエディタと言えば、vi(vim)かemacs。viのキー操作を覚えておけば、だいたいどこでも使える。 けど独特な上に量が多すぎて覚えにくいんだなー(嘆) とりあえず、重要そうなキーを太字にしてみました。 キー操作

    hirokist
    hirokist 2012/02/09
  • 読み応えのある”オススメまとめwiki”を教えてくだしあ

    名無しさん@HOME :2010/01/05(火) 22:24:59 0 皆さんのオススメまとめwikiを教えて下さい。 因みに私のオススメ。 義実家にしたスカッとするDQ返し http://www26.atwiki.jp/suka-dqgaesi/ 真のエネミーは義実家ではなく配偶者 http://www21.atwiki.jp/enemy/ 発見!泥棒~手癖の悪いママ http://www11.atwiki.jp/doroboumama/pages/1.html 2ch不倫板@wiki 不倫される時 http://www3.atwiki.jp/sare/ 8 名無しさん@HOME :2010/01/06(水) 18:33:09 0 ロミオメールまとめは? 9 名無しさん@HOME :2010/01/06(水) 18:34:20 0 http://www20.