転置インデックスによる検索システムを作ってみよう! 2007-11-26-5 [Algorithm][Programming] 転置インデックス[2007-06-17-6]による検索システムの実装は パフォーマンスを無視すれば意外と簡単です。 それを示すために Perl で簡単な検索システムを作ってみました。 検索方式は転置インデックス(Inverted Index)、 ランキングには TF-IDF[2005-10-12-1] を用いました。 検索対象ファイルは一行一記事で以下のフォーマットとします。 [記事ID][SPC][記事内容]\n 記事IDは数字、記事内容は UTF-8 の文字で構成されるものとします。 以下のようなサンプル test.txt を用意しました。 1 これはペンです 2 最近はどうですか? 3 ペンギン大好き 4 こんにちは。いかがおすごしですか? 5 ここ最近疲れ
ライブレポート shallm ライヴレポー… 【shallm ライヴレポート】 『shallm 2nd L… 2024年03月10日@ ザ・クロマニヨンズ … 【ザ・クロマニヨンズ ライヴレポート】 … 2024年02月29日@Spotify O-EAST CHiCO ライヴレポート 【CHiCO ライヴレポート】 『LAWSON presen… 2024年02月23日@ KT Zepp Yokohama 超ときめき♡宣伝部 … 【超ときめき♡宣伝部 ライヴレポート】 『… 2024年01月28日@横浜アリーナ 有華 ライヴレポート 【有華 ライヴレポート】 『有華ワンマンツ… 2024年01月27日@日本橋三井ホール
Search multiple video sharing sitesというエントリーより。 New search engine VDoogle lets you search for video across multiple sites, including Dailymotion, Google Video, iFilm, and YouTube. Google Video、iFilm、YouTubeなど、いわゆる動画共有サイトを横断検索することができる「VDoogle」という検索エンジンだそうです。 現時点では14の動画共有サイトがインデクスされており、Googleライクなインターフェースで検索することが可能です。 これは「Google Custom Search Engine」の機能が使われているということで、アイデア次第ということなのですね。 実際に検索するとこんな感じです。
「ウノウサーチ」は、ブラウザの履歴を保存しておいて、過去に自分が訪問したページだけを対象に検索できる無料のソフトウェアだ。 「以前見たあのサイトを探しているんだけど、URLを思い出せないし、検索しても見つからない……」「社内イントラネットのあのページにたどり着きたいが、トップページからリンクをたどるのは面倒だ」 こんな経験をした読者は多いのではないだろうか。ウノウが提供するアプリケーション「ウノウサーチ」では、自分が訪問したページの内容をブラウザのキャッシュとは別の場所に記憶しておき、そのページだけを対象に検索する。自分が見たページであれば、一般のWeb検索エンジンでは探せないイントラネットや会員制サイトも検索の対象になる。 ウノウサーチは、これまでウノウのエンジニアによる実験的なサービスの1つとして「ウノウラボ」で提供されてきたが、8月28日から正式版となった。利用は無料で、対応するOS
NTTレゾナントのポータルサイト「goo」は7月31日、Web検索からブログを除外した結果を表示できる「ブログフィルター」機能を追加した。 普及が進むブログだが、キーワードによってはWeb検索結果の上位をブログが占め、ブログ以外のサイトが見つけにくい──といったユーザーの声があったという。このため、検索結果からブログを除外するオプションを設定できるようにする。 具体的には、gooトップページか、Web検索の検索窓右側の検索オプションページで、条件設定「ブログを含まない」をチェックする。その上でキーワードを入力して検索を実行すると、ブログを含まない結果を表示できる。 また同時に、検索結果にQ&Aサービス「教えて!goo」の情報を表示する機能を拡充した。従来はキーワードと一致した「教えて!goo」の質問文を検索結果の上部に表示していたが、新たに結果の下部にも表示する。検索結果を一通り確認した上
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く