Results per page Results per page Sort Sort Preferred Languages Preferred Languages Labels Labels
米Microsoftが「BitFunnel」という新しいオープンソースプロジェクトを開始した。同社の検索エンジン「Bing」向けのアルゴリズムをベースとした実験的な情報検索システムで、高速さを特徴とする。現在、早期段階のコードが公開されている。 BitFunnelはBingで利用されている高性能な全文検索システム。キーワード、フレーズ、数学的表現を含むクエリに対してドキュメントを識別・ランク付けするアルゴリズムを持つ。BitFunnelのほか、C++表現「NativeJIT」、JavaおよびLuceneベースのツール「Workbench」の3種類のプロジェクトで構成される。ライセンスはMIT License。 開発チームによると、アルゴリズムの一部をオープンソースにした段階であり、新しいシステムが実際にドキュメントの解析やクエリ処理を行えるようになるにはもう少し時間を要するとしている。今後
ブログの更新頻度が落ちてるのは、Facebookに書いた方が有益なフィードバックの頻度が高くて、ついついそっちに書いてしまうから。 そうやってFacebookにばかり書いていると「あれ、この前Facebookに認知心理学が生まれてきた流れについて書いたと思うんだが、あれどこだったかな、参考にしたいのだが…」なんてことが起こるようになってきた。以前であれば、だいたいそういうのは自分のブログに書いているので、Googleに行って「西尾泰和 認知心理学」とかで検索すればすぐ見つかった。しかしFacebookに書いたものはそういうわけにはいかない。 で、発掘するのにすごく時間がかかったり、発掘できなくてあきらめてしまったりする。これってものすごい損失なのではないか?クロールして手元に保存して検索できるようにする必要があるのではないか? そしてそのクロールもまた手軽ではない。エクスポートの機能はある
真紀@DoPPelMaKi最近知ったTwitterの機能が便利なので共有。 公式の検索で 「@アカ名 since:2012-10-01 until:2012-10-31」 って検索すると通常遡れない過去ツイートが読める。 自分や好きなあの子の過去へGo! http://t.co/dvp8vE3B3j 2015/03/11 21:11:53 風柳@furyutei@maname 以前教えて頂いたのですが、日付だけでなく時刻やタイムゾーンの指定も可能みたいです。 since:2011-03-11_14:46:00_JST until:2011-03-11_14:47:00_JST http://t.co/lpbYmtYwzI 2015/03/13 02:47:27
GoogleやYahoo!の裏側にはどのような仕組みがあるのか GoogleやYahoo!などを使わない日はないくらい,検索エンジンは私たちに欠かせない存在となりました。しかし,そんな身近な検索エンジンがどのような仕組みになっているか,ご存知の方はあまりいらっしゃらないのではないでしょうか。 わざわざ検索エンジンを使うのは,膨大な量の文書に対して,特定の文字列が含まれているか知りたいからです。その時,すべての文書を検索しようとすると,データの量に比例して検索時間も増えてしまうという問題が起こります。でも,GoogleやYahoo!で検索すると,広大なインターネットの情報を見にいっているはずなのに,結果が一瞬で返ってきますよね。なぜかといえば,検索エンジンでは,事前に文書からインデックス(索引)を作成し,そのインデックスを用いて検索することで,文書量が増えても検索速度がそれほど低下しないで済
いつのまにかGoogleの検索結果に「アプリケーション」が出現していました。クリックすると各種アプリへのリンクが表示されるようになっており、非常にGoogleっぽい感じの検索結果なので、割と使い勝手のよいものになっています。 Google https://www.google.co.jp/ たとえば「twitter」で検索すると、「アプリケーション」という選択肢が増えているので、ここをクリック するとこのようにしてツイッター関連のアプリがずらずらと並びます。その数、実に1110万件。 同じようにして「Google」で検索した結果がコレ。8180万件ほど出てきます。 いろいろ調べてみると、Firefoxなどのブラウザの拡張機能、さらにフレーズによってはちゃんとWindowsPhoneなどのアプリも検索結果に表示されるため、「アプリ」と名の付くものは大体網羅しているようですが、中には「何このサ
By Global Panorama 「検索エンジンといえばGoogle」と言えるほど世界中で使われているGoogle検索は、ブロック崩しができるなど隠れたキーワードや機能がコッソリ追加されていることでも知られています。そんなGoogle検索で知っていると便利な工夫や、ちょっとしたキーワードの追加で超絶便利にしてくれる35機能がDigital Trendsでまとめられており、その中から27の機能が日本語でも使えることが確認できました。 The 35 Best Google Search Tips and Tricks | Digital Trends http://www.digitaltrends.com/computing/the-35-best-google-search-tips-and-tricks/ 検索での句読点、記号、演算子 - ウェブ検索 ヘルプ https://supp
これまでに、N-gramと形態素解析の2つの検索エンジンの、見出し語の切り出し方法を説明しました。今回は、2つの見出し語の切り出し方法を比較し、それぞれの得意な点、不得意な点を明らかにしていきます。 2つの手法の概要 はじめに、2つの手法をおさらいしてみます。 形態素解析 検索対象のテキストを形態素解析を行い分かち書きを行う 分かち書きした単位を見出し語として転置インデックスを作成する 転置インデックスを元に検索を行う N-gram 検索対象のテキストをN文字単位の文字列片に分解する 分解した文字列片を見出し語として転置インデックスを作成する 検索語をN文字単位の文字列片に分け検索を行う 文字列の出現位置情報を利用すれば、漏れのない完全一致の検索が可能 大きな違いは、「転置インデックスの見出し語をどのように作るか」というプロセスが異なる点です。形態素解析は構文解析を行って分かち書きを行う
前回は形態素解析を使う検索エンジンのしくみについて説明しました。今回は、FINDSPOTで使用しているN-gramという検索エンジンのしくみについて説明します。 N-gramによる見出し語の切り出し 前回は、形態素解析による検索エンジンでは、検索可能な最小単位が分かち書きの切り分け単位となる点を説明しました。 一方、N-gramを使った検索エンジンでは、単純に文字の並びを見出し語としてインデックスを作成します。1文字を元にインデックスを作成する方法をユニグラム、2文字の並びを元にインデックスを作成する方法をバイグラム、3文字の並びを元にインデックスを作成する方法をトリグラムと呼んでいます。 1文字:ユニグラム 2文字:バイグラム 3文字:トリグラム N-gramによる見出し語の切り出しは、形態素解析のための文法解析を伴わないため、特定の自然言語に依存しないという特徴があります。 FINDS
はじめまして、おんがえしと申します。 今回は私が作っているソースコード検索エンジンのMilkodeにて、rroonga(とその内部で動くgroonga)がどのように使われているのかを紹介します。 Milkodeの検索画面 ソースコードを検索するということ プログラマの仕事はプログラムを書くことですが、同じくらい「検索する」ことは多いのではないでしょうか。 ある関数の名前を変えたいので使っている箇所をすべて見つけたい ライブラリの仕様が変わった。使っているコードはどこだったか? コードリーディング中。今読んでいる関数の実体はどこにあるのか? ベーマガを買ってゲームのプログラムを写経していた頃から時代は進み、WebにアクセスすればゲームやOS、Webアプリなどのソースコードを無料[1]で手に入れることができるようになりました。必要なものをソースコードから検索し、知識として取り込んでいく技術は今
初めまして、インフラストラクチャー部の加藤 (@EugeneK) です。 クックパッドでは現在178万ものレシピが公開されていますが、目的のレシピを探すために検索機能を提供しています。 今回は検索機能の裏側の仕組みについて、インフラストラクチャーの観点からお話ししようと思います。 全ての検索機能を支えるSolrと周辺のアーキテクチャ クックパッドにはレシピの検索だけでなく様々な検索機能がありますが、その全てはSolrを活用して実装されています。 以前はMySQL Tritonnによる全文検索機能を使用していましたが、2011年頃からSolrに切り替わりました。 クックパッドではSolrをマスタ - スレーブ構成にすることで冗長性と負荷分散を実現しています。以下の構成図をご覧ください。 マスタとスレーブの間には、リピータと呼ばれる検索インデックスを中継するためだけの役割のサーバがいます。この
+1 ボタン 2 AMP 11 API 3 App Indexing 8 CAPTCHA 1 Chrome 2 First Click Free 1 Google アシスタント 1 Google ニュース 1 Google プレイス 2 Javascript 1 Lighthouse 4 Merchant Center 8 NoHacked 4 PageSpeed Insights 1 reCAPTCHA v3 1 Search Console 101 speed 1 イベント 25 ウェブマスターガイドライン 57 ウェブマスタークイズ 2 ウェブマスターツール 83 ウェブマスターフォーラム 10 オートコンプリート 1 お知らせ 69 クロールとインデックス 75 サイトクリニック 4 サイトマップ 15 しごと検索 1 スマートフォン 11 セーフブラウジング 5 セキュリティ 1
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く