このドメインは、お名前.comで取得されています。 お名前.comのトップページへ Copyright © 2020 GMO Internet, Inc. All Rights Reserved.
オープンソースの検索エンジンを開発する仏OpenSearchServerは11月27日、「OpenSearchServer 1.5」をリリースした。WindowsとLinux、UNIX、BSDに対応、プロジェクトのWebサイトよりダウンロードできる。 OpenSearchServerは大規模環境での利用をサポートする高性能な検索エンジン。メディア企業仏Infopro Communicationsが自社用の検索機能として開始した。現在開発者らは独立した企業として、開発とサポートを提供している。 Webユーザーインターフェイス、クローラー、Rest/Restful APIなどの機能を持ち、開発者は自分のアプリケーションに全文検索機能を統合できる。検索機能としては高機能な全文検索、スペル修正、自動入力補完、位置情報、フィルタなどがある。17の言語に対応し、自動で言語を認識するが、現時点では日本語
クックパッド、グリー、ぐるなび、CROOZは検索技術を どう使っているのか 有限会社オングス 杉山貴章 2012/2/9 2012年1月26日、CROOZ主催の勉強会「モーショノロジー2012 #1」が開催された。今回のテーマは「全文検索」。検索技術の開発や活用に携わる6名の発表者によって、検索エンジンの実装やプロダクトの活用事例などが紹介された。 全文検索の歴史とgroongaの索引構築の実装 ソーシャル連携などに広がるECサイトでの全文検索 KVSの膨大なKeyを見つけるための全文検索 groongaのRuby実装「rroonga」による検索サービス モバイルに欠かせない位置情報検索で使うgroonga レシピ検索のプロトタイピングにApache Solrを使う そもそも、「モーショノロジー」って何? そもそも、「モーショノロジー」とは何だろうか。総合司会を務めたCROOZの小俣泰明氏
What is Computer Vision? Computer vision seeks to develop algorithms that replicate one of the most amazing capabilities of the human brain - inferring properties of the external world purely by means of the light reflected from various objects to the eyes. We can determine how far away these objects are, how they are oriented with respect to us, and in relationship to various other objects. We re
転置インデックスから上位k件の文章を取ってくる手法について、知ってる範囲でまとめてみました。 転置インデックスとTop k-query View more presentations from tsubosaka この辺の話は教科書だと Information Retrieval: Implementing and Evaluating Search Engines (MIT Press) 作者: Stefan Buettcher,Charles L. A. Clarke,Gordon V. Cormack出版社/メーカー: The MIT Press発売日: 2010/07/23メディア: ハードカバー購入: 2人 クリック: 78回この商品を含むブログ (8件) を見る のChapter 5とかに疑似コードなども含め載っているので、参考になるかと思います。
検索エンジンの作り方教えます。グーグル自走カーのスタンフォード大教授が無料オンライン大学「Udacity」開校(動画)2012.01.30 13:006,530 satomi 昨秋、大学学部レベルのコンピュータサイエンス課程を無料で提供し、日本でも話題をふりまいたスタンフォード大。あれを担当したセバスチャン・スラン(Sebastian Thrun)教授が大学を辞め、なんとコンピュータサイエンス専門の無料オンライン大学「Udacity」をスタートしました! セバスチャン・スラン教授といえば、あのグーグルの自走カーをつくったお方。グーグルのフェロー(特別研究員)でもあります。 去年2月/TEDにて(日本語訳) 氏は秋の人工頭脳(AI)入門コースをスタンフォード大とオンラインの両方とも並行して担当したんですが、ロイターによると「オンラインコースの方が指導が密で教え方も良いため、リアルの大学のクラ
さて先日あることがきっかけでヒープスの法則 (Heaps' law) のことを思い出した.最初はヒープの法則と記憶していたのだけれど,'がHeapsの後ろにあるので,ヒープスの法則とかヒープス則と呼ぶのが正しいのだろう.ここではHeapsの法則と呼ぶことにする. Heapsの法則とはN語数から成るコーパスにおいて,総語彙数Dは以下の等式で表現できるというもの*1 ここで,kとβはコーパスによって定められた定数とする.英文コーパスではβは大体0.4-0.6になるらしい*2 この法則が示唆することは,コーパスサイズの増加に対して語彙は増え続けるというもの.まぁlogスケールにおいては直線なので,徐々にサチっていくのは確かであるが. Wikipediaでヒープスの法則の出展を調べてみると,どうやら1978年出版のHeaps著"Information Retrieval"[1]内で提案されたものら
SNSサービスを提供している米LinkedInは12月21日、同社傘下にある検索技術「IndexTank」をオープンソースソフトウェアとして公開した。IndexTankを利用することで、Webサイトやアプリケーションで検索機能を提供できるという。 IndexTankは検索サービス技術を提供するベンダーで、同社の技術はRedditやSpoke、TaskRabbitなどのWebサイトやサービスで利用されている。LinkedInは2011年10月にIndexTankを買収したが、買収発表時に将来IndexTankの技術をオープンソースとして公開する計画を明らかにしていた。 今回公開したのは、インデクシングエンジンである「IndexEngine」と、APIや「BackOffice」、「Storefront」、「Nebulizer」などからなるサービスコンポーネント。IndexEngineはリアルタ
先日,「全文検索エンジンgroongaを囲む夕べ 2」という勉強会でgroonga開発者の森大二郎さんから著書の「検索エンジンはなぜ見つけるのか」とそのサインを頂いたことをご報告しました. 全文検索エンジンgroongaを囲む夕べ2 #groonga - nokunoの日記Amazon.co.jp: 検索エンジンはなぜ見つけるのか ―知っておきたいウェブ情報検索の基礎知識: 森大二郎: 本 無料で貰うと書評を書かねばならないという@tasukuchanの言葉に怯え読まざるを得ない状況に追い込まれました(嘘です,本当は前から気になっていたのですが時間を取れずにいたところ今回を機に読んだ形になります).前評判通り,一般向けの分かりやすい言葉で説明しながら,内容は非常に濃い(というか本当に一般向けなのか疑わしい)本でした.比喩として図書館を持ち出しているあたりもうまいと思いました. 例えば2章は
前回のインタビューで、北山さんが「ハンパなく速いんですよ!」ってこれからお会いする山田さんの作品をベタ褒めしていたのを鮮明に覚えている。ソフトウェアの世界では、自動車のように中心部分をエンジンなんていうが、これは本当にすばらしい表現で、車種の数だけエンジンに特徴があり、この吹けあがりはどうだとか、パワーがあったり、安定性があったりする。ソフトウェアのエンジンも同様で、中にはひたすら速さを追求したF1エンジンみたいなものがあったりするのだ。 VNN1は実は昔、エンジン(車じゃなくってソフト)を作っていたので、外からは見えないが良いエンジンを作る人が本当は気になってしょうがない。ただ最近は、WEBに精通したソフトを作れるほうがかっこいいらしい。すこし悲しい。しかし今日は違うのだ。ソフトウェアの世界で最速ラップをたたき出そうとしてるエンジンビルダーの話が聞けるのだ! VNN1:早速ですが、山田さ
表のような転置インデックス完成後は、クエリに対する結果を返す処理は簡単です。例えば、ユーザーが「Vim」というクエリを発行すると、検索エンジンは「Vim」を含む文書IDリストを返します。表では文書IDの「2」を返します。 検索エンジンを取り巻く7つの技術 検索エンジンのコア技術は前節で紹介したインデックスです。しかし実際に、検索インデックスだけで構成する検索エンジンから、検索サービスを構築するには多大なコストが掛かります。以下の節で検索エンジンを利用したシステム、検索サービスを構築する際に便利なコンポーネントを紹介します。 これらの機能のいくつかは、多くの検索エンジンが組み込んでいます。一方で、簡素な検索エンジンは、以下で紹介するコンポーネントをサポートしていないため、ユーザーが独自に開発するか、その機能を持つコンポーネントを組み込む必要があるものもあります。 【1】トークナイザ 検索エン
2010年末に、3つに勉強会にて「全文検索エンジンgroonga」の紹介をさせていただきました。 第4回Solr勉強会 groongaを囲む夕べ ドワンゴ技術勉強会(2) MySQLについて それぞれの勉強会にて用いた発表資料を公開いたします。 groongaの紹介部分については使いまわしがバレバレですが、それぞれの勉強会の特性に合わせた味付けをしているので、ぜひご覧になっていただければ嬉しいです。勉強会当日のレポートをされている方もいらっしゃるようなので、興味のある方は検索してみるとよいでしょう。 また、groongaを囲む夕べに関しては、他の発表者さんの資料も以下のリンクから見ること...
検索エンジンの転置インデックスなどデータ列を小さいデータサイズで持たせたい、という状況がある。こういう場合圧縮符号を使うのが一般的でunary符号やgamma符号、delta符号など様々な種類がある。 圧縮符号の中でイチオシなのがvertical code(vcode)。これは岡野原(@hillbig)氏によって提案された圧縮符号で単純な仕組みでdelta符号並の性能を誇っている。 本記事ではvcodeのポイントを絞って30分でわかるように解説してみる。 vcodeは本棚に本を並べる作業を連想すると理解しやすい。本棚は予め高さが決まっているので全ての本が入るような本棚を用意する。つまり というようなものを想像する。 この本棚は8冊の本が並んでいるが左から5冊目の本が他よりも背が高い。このため5冊目の本に合わせて背の高い本棚が必要になる。だが他の本は5冊目の本ほどに背が高くないので、5冊目が
米サンフランシスコで開催されているWeb 2.0サミットにて、意外な人物が新製品を発表したそうだ(The New York Times、本家/.)。 その人物は90年代初め「U Can't Touch This」で一世を風靡したM.C.ハマー。新しい検索エンジン「WireDoo」を引っ提げてやってきたという。 この検索エンジンは検索結果に関連情報を付加してくれるものだそうで、例えば「車」と検索すれば車以外にも価格や保険、消費者安全レーティングなども返してくれるとのこと。また株価の銘柄記号を検索すれば関連した投資家や投資信託なども表示されるという。 WireDooは現在開発段階にあり、まだ公開はされていない。ハマー曰くGoogleのような大手と競合するつもりはなく、クエリに対し繋がりのある情報を提示できる「より深い検索」を提供できればと話したそうだ。 ラッパーであり、現在は格闘技選手のマネジ
高速道路で事故にあった自動車を通り過ぎるときに、大破した車を見ようと減速してしまう感覚は、皆さんもよくご存じのはずだ。筆者は新しい検索エンジンに関しても同じことをする。減速して血の海を探した後は、いつものGoogleを使っているときの速度に戻して、バックミラーに映る歪んだ金属のことは忘れてしまう。過去に大破した検索エンジンには、「Cuil」「Hakia」「Powerset」(「Bing」に統合)や、「Clusty」「RedZ」などがある。それぞれが独自の機能を備えていたが、すべて忘れ去られてしまった。衝突炎上して消えたものもあれば、創設者をお金持ちにした後で消えたものもあった。また、真のトラフィックが高速で通り過ぎるのを尻目に、今も路肩を低速で進んでいる検索エンジンもある。 だが少し待ってほしい。「Blekko」という別の検索エンジンがある。最高経営責任者(CEO)のRick Skrent
「情報検索:検索エンジンの実装と評価」が届きました 2010-09-27-2 [Book] アメリカのアマゾンから会社の人々と共同購入した「Information Retrieval: Implementing and Evaluating Search Engines」(情報検索:検索エンジンの実装と評価)が届きました。 ■Stefan Buettcher, Charles L. A. Clarke, Gordon V. Cormack / Information Retrieval: Implementing and Evaluating Search Engines しばらく読む余裕がなさげなのですが、そのうちじわじわと。 ref. - [を] メモ「情報検索:検索エンジンの実装と評価」[2010-05-20-8]
SEOの基礎、パート9です。 今回は核になるキーワード(Core Terms)について解説された記事になります。 以下はStoney deGeyter氏による「SEO 101 – Part 9: Everything You Need To Know About Keyword Core Terms」の全訳になります。もし誤訳や解釈のミスなどがありましたら、ぜひご指摘ください。可能な限り修正していきたいと思います。 SEO101 – Part9: 中核キーワードについてこれだけは知っておきたいこと 以下のシリーズはニューヨークでL’Oreal主催の美容系ブロガーグループに行ったプレゼンテーションから転用したものである。プレゼンテーションのほとんどは、ブログを検索エンジンとユーザーに優しいものにする方法について用意されたものだが、ここで私はあらゆる業界をまたがって製品やサービスを販売するサイ
Search engine marketing, or SEM, is one of the most effective ways to grow your business in an increasingly competitive marketplace. With millions of businesses out there all vying for the same eyeballs, it’s never been more important to advertise online, and search engine marketing is the one of the most effective ways to promote your products and grow your business. In this guide, you’ll learn a
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く