Posterous Spaces is no longer available Thanks to all of my @posterous peeps. Y'all made this a crazy ride and it was an honor and pleasure working with all of y'all. Thanks to all of the users. Thanks to the academy. Nobody will read this.
エリアダスとは スマートフォンの画面に表示した地図(エリア)にマッチした「話題の言葉」を表示するAndroidアプリケーションです。 その「話題の言葉」をタップするだけで、そのエリアについて書かれているブログ記事を簡単に検索できます。 新しいブログ記事が投稿されると、表示される「話題の言葉」が変化するため、従来のクチコミサイトにないお店の情報や、タウン情報誌より新しい話題にスマートフォンから簡単にアクセスできるようになります。
梅雨。部屋干しした洗濯物による異臭騒ぎに苦しむmikioです。今回は、Tokyo Cabinetのテーブルデータベースで超お手軽に全文検索をする方法について説明します。 使い方 テーブルデータベースについてまずおさらいしておきましょう。PerlやRubyのハッシュのようにコラム名とその値を関連づけた構造を、主キーを識別子として保存するデータベースです。例えばRubyからデータを保存するに以下のように行います。データベースであることをほとんど意識させないというのが素敵ポイントです。APIはCでもPerlでもRubyでもほとんど同じなので、言語にかかわらず同じようにレコードを操作できます。 require 'tokyocabinet' include TokyoCabinet # データベースを開く tdb = TDB::new tdb.open("casket", TDB::OWRITER
というわけで、途中からですが第5回Solr勉強会に参加しました。会場は#TokyoNLPと同じECナビさん。Solrは最近勢いのあるオープンソースの全文検索エンジンで、mecabを使ったりして日本語の検索にも対応しているようです。第5回Solr勉強会 : ATNDWelcome to Solr Tokenizer いろいろ比較 by @haruyamaさん (途中から) Igoという形態素解析器がある Ngram系 vs 形態素解析:Ngram系のほうが速い バージョン3.1.0 vs 1.4.1: ほとんど差はなし モテるSolr系女子力の(ry 本日をもってECナビを退社→転職先募集中! 図書館でのSolrの使い方 by @nabetaさん(田辺浩介) Project Next-LのはなしProject Next-L Official Page Next-L Enju: オープンソース
[読了時間:4分] mixi日記が「過去に起こったこと」を伝えるツール、Twitterが「いま起きていること」を伝えるツールだとすれば、新しくローンチされた「Ditto(ディトー)」は「これからしたいこと」を伝えるコミュニケーションツールだ。 無料のiPhoneアプリとしてリリースされたばかりだが、「Eat out(外食)」「Coffee」「Shopping」などといった12個のアイコンの中から、これからしたいこと選んで意思を表明するツールだ。例えば「Coffee」を選ぶと、「Tsuruaki Y.(ここはユーザーの名前)wants to have coffee(鶴章はコーヒーを飲みたいと思っている)」というメッセージをFacebookやTwitterに流すことができる。その際に「select coffee shop」という文字のところをタップすれば、近隣のコーヒーショップがリストアップさ
Greplinは、いわばソーシャルメディア趨勢時代のパーソナル検索エンジンと言えるだろう。DropboxやEvernoteに保存している各種情報を一括で検索することはもちろん、Twitterやfacebookのアカウントを登録しておけば、自分がフォロー(友達になって)しているユーザーの動向を検索できる。検索結果を得るのがとても高速である上、最新の投稿はリアルタイムでも更新されてくるので、少し使用しただけで手離せなくなってしまうだろう。 登録できるのは、TwitterやFacebook、Dropbox、Evernote以外にもGmail(Apps版もOKだが有料)やカレンダー、SNSのLikedIn、日本ではあまり馴染みないがSafesforceやYammr、Basecampなどにも対応。今後も続々と対応サービスが増える見込みだ。 より多くのソーシャルメディア&クラウドに対応するほど膨大な検
すみません。タイトルはやや釣り気味です。 類似検索エンジンというか、そのアイデア程度の話なんですが、以前から考えていた類似検索エンジン風のネタがあったので、ちょっとperlで書いてみたので、そいつを晒してみます。 Luigi https://github.com/miki/Luigi 類似検索なのでLuigi。ルイージとか読みたい人はそう読んじゃっても良いです。(冷) 考え方と仕組み 類似文書の検索、となりますと一般的には超高次元での空間インデックスとかが必要になります。 昔からR-TreeやSR-Treeなど、いろいろと提案されていますが、より高次元になると「次元の呪い」によりパフォーマンスが出なくなる、なんて言われていますね。 そこで最近ではLSHに代表されるような、より高度な「近似」型のインデキシング手法が人気を集めているようです。 で、今回考えたLuigiも実は近似型のインデッ
世間はツイッターが大流行していますが、今回は今後数年以内にブレイクするかもしれない新興検索エンジンを4つ紹介します。どれもオリジナリティあふれる機能を持っていてユニークな検索サービス。ネットマーケッターなら先物買いで知っておきたい。 — SEO Japan あなたもGoogleやBing、さらにはTwitterなどのサイトでのSEOについては聞いたことがあると思うが、そこで疑問なのは、その次は何なのかということだ。デジタル時代のマーケッターはデータとコンテンツを必要としていて、世の中に溢れかえっている大量の事柄を整理するために数多くの革新的なツールが登場している。ここに、2012年までに検索で大きな波を起こすであろう4つの検索エンジンを紹介する。 OneRiot – リアルタイム検索エンジン 売り文句:「OneRiotは、TwitterやDiggなどのソーシャル共有サービスで共有されたリン
\閉鎖予定のサイトも売れるかも?/ アクセスがないサイトもコンテンツ価値で売れる場合も… ドメインの有効期限を更新してサイト売却にトライしてみましょう
社会科見学の初日は韓国のシェアNo.1検索エンジンNaverのオフィス訪問。会社はJR大崎駅前の ThinkTower 内。実はこちらにお邪魔するのは3回目で、ほぼ毎年訪れているのだが、いろいろとお邪魔する度に違いがあって、業界内の動きは早いなぁと実感する。 今回連れて行ったのは@shirayuくん、@syou6162さんに、@hayato_g くんと naoya-i くんの4人である。naoya-i くんは M2、残りのメンバーは M1 である。 やはり外資系の企業だけあって、本国の文化の影響がいろいろなところにある(社員さんも韓国の人いたり)のだが、多文化で働きたい人に取ってはおもしろい環境なんではないかなーと思ったり。 あと、日本の検索エンジンのシェアトップは Yahoo! であり、Google がそれを追い上げて現在2強になっているのだが、3位以下の企業は正面から彼らにぶつかる必要
平成20年度 東京大学大学院 情報理工学系研究科・コンピュータ科学専攻 配列解析アルゴリズム特論I 4/10 4/17 4/24 5/1 5/8 5/15 5/22 5/29 (The problem to be reported - in English) 6/5 6/12 6/19 7/3 7/10 7/17 東京大学 理学部・情報科学科 情報科学特別講義3 (情報科学とバイオインフォマティクス) 6/10 7/15 7/22 東京大学大学院 新領域創成科学研究科・情報生命科学専攻 情報生命科学基礎/演習 5/27 6/17 京都大学大学院 薬学研究科・医薬創成情報科学専攻 情報科学概論 6/3 中央大学大学院 理工学系研究科・物理学専攻 物理学特別講義第二 TBA 創価大学工学部 生命情報工学科 TBA TBA 戻る Copyright (c) 2004- Tetsuo
はじめに 大規模なデータを扱うアプリケーションでは、速度とともに作業領域量も大きな問題となります。作業領域がメインメモリに収まらない場合、スワッピングが発生し、大幅な速度低下につながります。そのため近年、データ構造は高速なだけでなく、作業領域量が小さいことも求められています。今回紹介するのは2003年に提案されたデータ構造、wavelet tree(以下「WT」と表記)です。WTは圧縮索引やSuccinct Data Structureなど、データをコンパクトに表現する際に重要なデータ構造です。WTは文字列T[0...n-1]が与えられた時、次の2つの操作を定数時間でサポートします。rank(p, c)――T[0...p]中のcの出現回数を返すselect(i, c)――(i+1)番目のcの位置を返す WTの作業領域量は、文字列をそのまま保存した時の約2倍程度です。対象読者 C++の利用
This is the companion website for the following book. Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. You can order this book at CUP, at your local bookstore or on the internet. The best search term to use is the ISBN: 0521865719. The book aims to provide a modern approach to information retrieval from a co
さあ、今日は全世界で10億人に及ぶ検索エンジンユーザーの深層心理に迫って、彼らが検索エンジンを使う動機をより包括的に探ってみよう。この(疑似)心理学的な洞察は、ターゲティングやクリック率、広告配信などの視野を広げ、相対的価値まで把握する一助になるかもしれない。 まず、検索エンジンとはツールであることを理解しておく必要がある。つまり、何かの意図をもって用いるリソースだってことだ。検索ボックスを使うのは、ブックマークからIHT.comやredditやSEOmozなどのサイトにアクセスするのと本質的に違うんだよね。StumbleUponツールバーの「stumble」ボタンをクリックしたり、お気に入りのブログにアクセスするのとも違う。検索とは、その背景に「何かを見つけたい」という直接的な意図があるんだ。この「何か」を、以下のように分類してみたので、いっしょに見ていこう。 ナビゲーション型の検索 ナ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く