タグ

検索に関するaTSUSHiのブックマーク (4)

  • 全文検索 - Wikipedia

    順次走査検索、逐次検索ともいう。「grep」とはUNIXにおける文字列検索コマンドであり、複数のテキストファイルの内容を順次走査していくことで、検索対象となる文字列を探し出す。一般に「grep型」と呼ばれる検索手法は、事前に索引ファイル(インデックス)を作成せず、ファイルを順次走査していくために、検索対象の増加に伴って検索速度が低下するのが特徴である。ちなみに「grep型」とは実際にgrepコマンドを使っているという意味ではない。 インデックス作成型全文検索システム 検索対象となる文書数が膨大な場合、grep型では検索を行うたびに1つ1つの文書にアクセスし、該当データを逐次検索するので、検索対象文書の増加に比例して、検索にかかる時間も長くなっていってしまう。そこであらかじめ検索対象となる文書群を走査しておき、高速な検索が可能になるような索引データを準備することで、検索時のパフォーマンスを向

    全文検索 - Wikipedia
    aTSUSHi
    aTSUSHi 2010/08/15
    フリーの全文検索エンジン探すべし
  • TechCrunch | Startup and Technology News

    When Bowery Capital general partner Loren Straub started talking to a startup from the latest Y Combinator accelerator batch a few months ago, she thought it was strange that the company didn’t have a lead investor for the round it was raising. Even stranger, the founders didn’t seem to be…

    TechCrunch | Startup and Technology News
    aTSUSHi
    aTSUSHi 2010/07/18
    セマンティックWebというコンセプトが実現されつつある?
  • Linuxでのエラーの意味や対処法を検索できるサイト「OSSメッセージペディア」公開

    ユニアデックスは4月25日,Linuxのエラー・メッセージの意味,対処方法などを検索できるサイト「OSSメッセージペディア」を公開した。独立行政法人 情報処理推進機構(IPA)の「オープンソースソフトウエア活用基盤整備事業」としてユニアデックスが開発,同社が運用している。 「Linuxには,汎用コンピューターやUNIXでは一般的に標準提供されているメッセージ・マニュアルが存在しない」(ユニアデックス)。オープンソースであるためソースコードにあたるなどして調査することは可能だが「Linux技術者も業界全体で慢性的に不足しているため、その対応には時間がかかるのが現状」(ユニアデックス)であることから,メッセージペディアを開発した。 現在登録されているメッセージは356件で,Linuxカーネル障害時に通常表示される可能性のあるメッセージの1割弱に相当するという。日立製作所,ミラクル・リナックスと

    Linuxでのエラーの意味や対処法を検索できるサイト「OSSメッセージペディア」公開
  • ITmedia News:「つまんない」「暇」を検索入力・会員100万人は簡単――携帯ネットの意外な“常識” (1/2)

    携帯電話のネットサービスへの注目が急速に高まっている。3G携帯が普及して通信速度が向上し、「モバゲータウン」など携帯向けSNSユーザーも急増中。PC向けネットサービス各社も、携帯対応に注力している。 ただ携帯ネットはこれまで、10代中心に盛り上がってきた世界。PCネットをヘビーに使う人ほど携帯ネットは使わない傾向にあり、20代以上のPCユーザーにとっては未知の部分も大きい。 月間120万人が利用する携帯検索ポータル「F★ROUTE」を展開するビットレイティングスの佐藤崇社長に、携帯ネットの特徴を聞いてみた。するとPCネット界の常識では考えられないような事実――「“つまんない”“ヒマ”が頻出検索ワード」「検索ボタンには『検索』ではなく『Go!』と書く」「逆ザヤ広告を出してでも、公式サイトの掲載順アップを狙う」「サービス名に“★”マークでアクセスアップ」「100万ユーザーまでは増えるが、それ以

    ITmedia News:「つまんない」「暇」を検索入力・会員100万人は簡単――携帯ネットの意外な“常識” (1/2)
  • 1