hirokistのブックマーク / 2012年2月9日

hirokist id:hirokist

2012年2月9日のブックマーク (8件)

最近のSuffix Arrayによる全文検索について調べてみた - EchizenBlog-Zwei
ちょっと興味があったので調べてみた。全文検索には主に転置インデックス(Inverted Index)によるものと接尾辞配列(Suffix Array)/接尾辞木(Suffix Tree)によるものがある。前者は効率的にデータを扱えるものの、キーワード単位でしかインデックスを付けられないので形態素解析するなどして検索対象のテキストからキーワードを取り出す必要がある。後者は任意のクエリにマッチすることができるもののデータサイズが大きくなりがちであることと検索結果となる文書にスコア付けができないなどの問題がある。最近ではSuffix Array/Treeによる全文検索に対して簡潔データ構造(Succinct Data Structure)を導入してデータサイズを小さくしたり、スコアをもたせる方法が提案されたりと何かと話題が多い。 Suffix Array/Treeが持つ文書検索の機能は、
hirokist 2012/02/09
データ構造
リンク
Algorithm - Suffix Array を JavaScript で再発明してみた : 404 Blog Not Found
2012年01月16日16:30 カテゴリアルゴリズム百選Lightweight Languages Algorithm - Suffix Array を JavaScript で再発明してみた WEB+DB 総集編 [Vol. 1〜60] もう10年以上前に某社のCTOだったころ、Suffix array(接尾辞配列)の解説を毎週の技術者ミーティングでしたら一名を除いて「ハァ?」状態だったことを思い出しつつ。 Suffix Arrayは何が画期的だったのか? 以下は、計算機科学者でなくても直感的に理解できると思います。ソートされていない通常のデータの中にあるサブデータ(キー)を検索しようとすると、データの大きさに比例した時間(O(n))がかかる。ソート済みのデータであれば、二分探索でデータの大きさの対数時間(O(logn))でキーを検索できる。さらにキーからIDを定数時間で作成でき
hirokist 2012/02/09
プログラミング

アルゴリズム
リンク
研究室に配属されたばかりのB4にそっと渡したい一冊‐それが「入門ソーシャルデータ」 - シリコンの谷のゾンビ
オライリー・ジャパンさんから頂いた「入門ソーシャルデータ」を読みました．入門ソーシャルデータ ―データマイニング、分析、可視化のテクニック作者: Matthew A. Russell,奥野陽（監訳）,佐藤敏紀（監訳）,瀬戸口光宏（監訳）,原川浩一（監訳）,水野貴明（監訳）,長尾高弘出版社/メーカー: オライリージャパン発売日: 2011/11/26メディア: 大型本購入: 18人クリック: 779回この商品を含むブログ (42件) を見るご紹介いただいた@overlastさん，オライリー・ジャパンさんどうもありがとうございます! 記念すべき人生初献本．なんと監訳者全員が (IIR輪講などの勉強会を通じて) 知っている方だったのでびっくり．さて，遅ればせながら本書のレビューを書きたいと思います．ただ，すでに著名なメンバーがレビューを書いていらっしゃるので，できるだけ観点がかぶらな
hirokist 2012/02/09
自然言語処理
リンク
無料で見られるプログラミング関連書籍一覧 - YAMAGUCHI::weblog
はじめにこんにちは、動画配信界の情弱です。年始からStackOverflow眺めてたら超絶便利な質問に神回答がされてたので忘れないうちにメモっておく。2012年どっかで役に立てばいいですね。参考オリジナルはこちら。ここではコメントにパラパラと載ってたので、まずは直近1ページ目だけにあったものを1個のリストにまとめてみた。ほぼGeorge Stocker氏による回答を載せただけだけど。あとちょっとだけ自分で和訳とか加えたので、知っているものがあればコメントに載せて下さい。追加します。まだDとかFactorとか載ってないし、Pythonも全然足りないし。 API Only - Stack Exchange もしかするとバージョンが古かったりするものもあるかも知れませんが、それもコメントで教えてもらえるとその旨追記します。他にも過去に挙がったもののリンク ReadWriteWebのプログ
hirokist 2012/02/09
英語

プログラミング
リンク
git - 簡単ガイド
アッド & コミット変更されたファイルを選択します。 git add <filename> git add * を実行するとIndexに追加されます。これは基本的な作業の一つです。変更を実際に適用するには git commit -m "Commit message" を実行します。変更がHEADに入りましたが、リモートリポジトリには未だ入っていません。変更のプッシュこの時点で、変更がローカルリポジトリのHEADに適用されました。この変更をリモートリポジトリに適用するには git push origin master を実行し、masterの代わりに適用のブランチ名を入れます。もし既存リポジトリをクローンせずに使用した場合 git remote add origin <server> を実行すると、リモートリポジトリを登録する事が可能です。これで変更を特定なリモートリポジト
hirokist 2012/02/09
git

バージョン管理
リンク
Vim講座1 - think and error
Vim講座3 - think and error テキストエディタであるvimはとても扱いやすいのだが、Vimてモード概念があって敷居が高い（誤用）よね。ということで少しだけ書いてみる。 viキー操作メモ(Hishidama's vi Memo) こんなサイトもあるわけなのだけど、これ不便。普段使わないものまで全て書いてあるからだ。初心者にとっては、どこまで知ればミニマルなのかが知りたいというのに。概要モード概念カーソル移動インサートモードへ保存 ////////////基礎終了//////////// ビジュアルモードとコピペジャンプ置換 Undo,Redo[***IMPORTANT***] 一文字置換こうやってみると長そうだね．モード概念モードは4つ。ノーマルモード、インサートモード、ビジュアルモード、コマンドモード。ノーマルモード起動したときはこのモード。移
hirokist 2012/02/09
Vim
リンク
viキー操作メモ(Hishidama's vi Memo)
S-JIS[2003-05-19/2007-01-16] 変更履歴viエディター操作 UNIXでエディタと言えば、vi（vim）かemacs。viのキー操作を覚えておけば、だいたいどこでも使える。けど独特な上に量が多すぎて覚えにくいんだなー(嘆) とりあえず、重要そうなキーを太字にしてみました。キー操作
hirokist 2012/02/09
Vim
リンク
読み応えのある”オススメまとめwiki”を教えてくだしあ
名無しさん＠ＨＯＭＥ :2010/01/05(火) 22:24:59 0 皆さんのオススメまとめwikiを教えて下さい。因みに私のオススメ。義実家にしたスカッとするＤＱ返し http://www26.atwiki.jp/suka-dqgaesi/ 真のエネミーは義実家ではなく配偶者 http://www21.atwiki.jp/enemy/ 発見！泥棒～手癖の悪いママ http://www11.atwiki.jp/doroboumama/pages/1.html 2ch 不倫板@wiki 不倫される時 http://www3.atwiki.jp/sare/ 8 名無しさん＠ＨＯＭＥ :2010/01/06(水) 18:33:09 0 ロミオメールまとめは？ 9 名無しさん＠ＨＯＭＥ :2010/01/06(水) 18:34:20 0 http://www20.
hirokist 2012/02/09
読み物

あとで読む

まとめ
リンク
- 2012年2月10日
- 2012年2月9日
- 2012年2月8日