タグ

検索に関するchezouのブックマーク (5)

  • 第4回 rroongaを使ったソースコード検索エンジンMilkode | gihyo.jp

    はじめまして、おんがえしと申します。 今回は私が作っているソースコード検索エンジンのMilkodeにて、rroonga(とその内部で動くgroonga)がどのように使われているのかを紹介します。 Milkodeの検索画面 ソースコードを検索するということ プログラマの仕事はプログラムを書くことですが、同じくらい「検索する」ことは多いのではないでしょうか。 ある関数の名前を変えたいので使っている箇所をすべて見つけたい ライブラリの仕様が変わった。使っているコードはどこだったか? コードリーディング中。今読んでいる関数の実体はどこにあるのか? ベーマガを買ってゲームのプログラムを写経していた頃から時代は進み、WebにアクセスすればゲームやOS、Webアプリなどのソースコードを無料[1]で手に入れることができるようになりました。必要なものをソースコードから検索し、知識として取り込んでいく技術は今

    第4回 rroongaを使ったソースコード検索エンジンMilkode | gihyo.jp
    chezou
    chezou 2013/05/22
    groongaの中の方まで解説してくれるかなー?
  • Googleに会話型検索が登場、これは全く新しい情報の探し方だ![ #io13 ]

    Googleに会話型検索が登場、これは全く新しい情報の探し方だ![ #io13 ]2013.05.16 04:40 グーグルは検索機能に新しい機能を追加しました。「会話」です。 Googleと音声で会話ができるようになって、検索がよりパーソナルな体験になります。例えば「ロンドンへの飛行機の便は?」のように検索が可能になったり、今後のロンドンへの飛行機の予定を探すことが可能になります。言ってみればGoogle Nowの検索版です。 この機能の素晴らしいところは、PCとモバイル端末の両方に対応していること。「OK, Google。次の予約の近くでレストランを探して」と言うだけで、そのとおりに検索してくれます。Siriがもっとリアルになったイメージでしょうか? この機能にはグーグル気度を感じます。新しい検索では、Knowledge Graph情報を使って検索の質問への回答を見つけます。 近所

    Googleに会話型検索が登場、これは全く新しい情報の探し方だ![ #io13 ]
    chezou
    chezou 2013/05/16
    ほー、Googleも対話検索出してきたか。しかも、ナレッジグラフ対応は熱い!
  • groonga 索引構築の実装

  • SimString - 高速かつシンプルな類似文字列検索ライブラリ

    SimStringは,類似文字列検索のための高速かつシンプルなライブラリです. 類似文字列検索とは,文字列集合(データベース)の中から,クエリ文字列との類似度が閾値以上のものを,見つけ出す操作です. クエリ文字列と完全に一致しなくても,データベース中の似ている文字列を検索することができるので,スペル訂正,あいまい計算,柔軟な辞書マッチング,重複レコード検出,データベース統合など,様々なアプリケーションを構築できます. SimStringは,類似度関数として,コサイン係数,ジャッカード係数,ダイス係数,オーバーラップ係数に対応しています. 文字列の類似度を計算するための特徴量としては,文字nグラムをサポートしています. SimStringには,次のような特徴があります. 高速な類似文字列検索アルゴリズム.Google Web1T の英語単語(13,588,391文字列)から,コサイン類似度が

    chezou
    chezou 2013/02/16
    recall100%を保証する類似文字列検索
  • ツイートID生成とツイッターリアルタイム検索システムの話

    AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design PatternAmazon Web Services Japan

    ツイートID生成とツイッターリアルタイム検索システムの話
  • 1