タグ

searchに関するfubaのブックマーク (10)

  • MinHashによる高速な類似検索 - Preferred Networks Research & Development

    年が明けてもう一ヶ月経ちましたね.岡野原です. 今日はMinHashと呼ばれる手法を紹介します.これは特徴ベクトルの高速な類似検索に利用することができます(クローラーの文脈だとShingleとして知られている). 今や世の中のあらゆる種類のデータが,高次元のバイナリベクトルからなる特徴ベクトルで表されて処理されるようになってきました.例えば文書データであれば文書中に出現する単語やキーワードの出現情報を並べた単語空間ベクトル(Bag of Words)で表し,画像データも,SIFTをはじめとした局所特徴量を並べた特徴ベクトル(とそれをSkecth化したもの)として表せます.行動情報や時系列データも特徴量をうまく抽出する.グラフデータもFast subtree kernels[1]と呼ばれる方法で非常に効率的に特徴ベクトルに変換することができ,グラフの特徴をよく捉えることができるのが最近わかっ

    MinHashによる高速な類似検索 - Preferred Networks Research & Development
  • moe.imouto

    fuba
    fuba 2009/05/09
    moe.imouto.orgの類似画像検索。高精度でdanbooruとかから二次絵を検索できて異常に便利
  • Google code search

    This site is made possible by member support. ❤️ Big thanks to Arcustech for hosting the site and offering amazing tech support. When you buy through links on kottke.org, I may earn an affiliate commission. Thanks for supporting the site! kottke.org. home of fine hypertext products since 1998. 🍔  💀  📸  😭  🕳️  🤠  🎬  🥔 Google launched a new code search feature today. At least two sites alrea

  • 開発メモ:アンチ検索ベース

  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
    fuba
    fuba 2006/06/02
    "Bloglinesの検索がなんかリニューアルしたげ" やっと使い物になるように
  • ソースコード検索の ack がよさげな件: blog.bulknews.net

    ソースコード検索の ack がよさげな件 #catalyst でちょっと話題になっていた ack をいれてみた。CPAN シェルから install App::Ack とするだけ。 基的には grep -r | grep -v .svn | grep -v \~ に飽きてしまった人むけのソースコード検索ツールです。gonzui などとは違いインデックスはつくらないでそのままディレクトリをトラバースして検索するので、あまり大規模だと時間がかかるかもしれませんが、中規模なプロジェクトなら問題なくいけるのでは。 デフォルトで CVS, RCS, .svn, blib といったバージョン管理ディレクトリを無視、-i, -v といった grep 由来のコマンドラインや、 --perlperl ソースコードだけ検索、となかなか気が利いています。デフォルトのカラーリングもイケテル。 grep -

    fuba
    fuba 2006/05/30
    つかってみた。べんり
  • AmazonがWeb 2.0企業だなんて笑わせる - YAMDAS現更新履歴

    Amazon980円劇場の後になんだが、最近 Amazon に腹を立てさせられることが多い。何よりひどいのはその検索性の悪さ。これは Amazon.co.jp だけの問題なのか? 例を挙げると、 「Wiki」で検索して『PukiWiki入門 まとめサイトをつくろう!』(asin:4798109223)がヒットしない 「フォルティ」で検索して『フォルティタワーズ』(asin:B00005YUXG)がヒットしない 「Joe Jackson」で検索するとマイコーだらけになる。どこに Joe が入ってんだよ! 「Velvet Underground」で検索して最新 DVD『ライヴ MCMXCIII』がヒットしない もうアホかとバカかと。これを嘆いたところ Yasazon を使うようアドバイスされたのだが、それでも上の問題がすべて解決するわけじゃないんだよな……

    AmazonがWeb 2.0企業だなんて笑わせる - YAMDAS現更新履歴
    fuba
    fuba 2006/03/30
    検索語の分かち書きは日本語固有なのでたぶんさぼってる。データベースの品質は根回しが必要な問題。Joe Jackson問題はカテゴリがあるのに検索結果に出ないのは理解不能。そのへんの泥臭いUI改善を端折ってユーザに任せ
  • Tociyuki::Diary

  • 更新履歴兼雑記 - Wikipedia Formula Search

    http://shinh.skr.jp/wfs/ 数式って検索できないから不便だよね…と思って、まぁ既存であるかもしれないんですけど、検索エンジンとか作ってみたかったんで作ってみました。 現段階でもそれなりに遊べる…と思います。主な問題点は以下のようなものだと思います。 と入力したら の結果も出るようにしたいです。実装するつもりで、方法もだいたい考えてありますが、ちょっとめんどくさそうなのでしてません。 ja.wikipedia.org からしか検索できません。とりあえず現状 DB がバカでかくなってるのがまず問題です。すぐ小さくできると思ってますので、小さくしたら en.wikipedia.org とかも取り込んでみたいな、と。あと私個人の目的としては quant-ph をローカルででも取り込みたいなと思ってます。 \langle が < でも出る、 \iint が \int でも出る、

    更新履歴兼雑記 - Wikipedia Formula Search
  • ブログ検索を使う時って - StarChartLog

    昨日のAsk.jpやGoogleのブログ検索ベータテスト開始ニュースを受けて、辺境から戯れ言で、こんなことが指摘されてたのでちょっと考えてみました。 って意味があるの? 検索のレンジを「blog」に限定してるだけの話でしょ。 どう限定しているかに各社違いがあるけれど、確かに「検索をブログに限定しているだけ」ってのは事実。 現状のブログ検索と呼ばれるもので、通常の全文検索に比べての利点はこんなもの。 ロボットの巡回間隔が短い ある商品の感想が欲しい場合、ショップサイトを排除できる ブログ界隈で起きている議論を追いかけるのに適している あれ、3つしかないや。しかも「ショップサイトを排除できる」といっても、アフィリエイトブログは排除できません。 他に通常検索ではなくブログ検索を使う理由ってのがあったら教えてください。 Googleの通常検索からブログを除く、という噂は前から出てたような気がします

    ブログ検索を使う時って - StarChartLog
  • 1