ニュース Google、次世代検索アーキテクチャをテスト公開 Googleが、数カ月前から秘密プロジェクトとして取り組んでいた次世代検索インフラをデベロッパープレビューとして公開した。 2009年08月11日 14時23分 更新 米Googleは8月10日、次世代Web検索アーキテク... 続きを読む
2009年4月8日(水) 13:00〜15:30に開催されましたPreferred Infrastructureによる製品紹介セミナーの発表資料です。 続きを読む
どうぶつの森にハマって、たぬきち商店が早終いする関係で退勤時間もめっさ早くなったmikioです。今回は、Tokyo TyrantのキャッシュとLua拡張を使って超お手軽にリアルタイム検索システムを作る方法について述べます。 ユースケース 高い頻度で更新されるWeb上... 続きを読む
朝のジョギング生活を絶賛継続中ですが、あまり体重が減らなくてショボンヌなmikioです。さて今回は、Tokyo Dystopiaを使った検索機能「かんたん友人検索」の設計と実装についてお話しします。 全体の戦略 Tokyo Dystopia(TD)は単なる全文検索用のインデック... 続きを読む
Patents.com provides the most comprehensive worldwide source of searchable indexed patent pages available in 15 native languagePatents.com provides one of the most comprehensive free patent search sites on the web. Our powerful patent search ... 続きを読む
ニュース 元Google技術者、新たな検索エンジンを立ち上げ 新しい検索エンジン「Cuil」は、従来のリンク分析ではなく、Webページの内容の分析に基づいて検索順位を決める。 2008年07月28日 14時55分 更新 元Googleエンジニアが立ち上げた企業Cuilが7月28日、従来... 続きを読む
【Technobahn 2008/7/28 18:44】グーグルのチーフ・アーキテクトとしてランキングや広告マッチングの技術開発を主導してきた検索エンジンテクノロジーの専門家、アンナ・パターソンさんがグーグルを独立後、開発を進めてきた検索エンジン「Cuil(クイル)」が28... 続きを読む
Senna, 全文検索弊社森(オラの上司)が大阪市立大学で発表をしてきました。発表資料は以下からどぞー。検索エンジンの歴史的意義と未来 発表の前半は、コミュニケーション技術の歴史を踏まえ、多対1のコミュニケーション技術として検索エンジンを捉える試みで... 続きを読む
Introduction to Information Retrieval 輪読会 9章の復習資料を以下にアップロードしました。http://bloghackers.net/~naoya/iir/ppt/iir_09.ppt9章は、検索結果の適合性を改善するするための二つのアプローチ、Relevance Feedback (RF) とクエリ拡張について... 続きを読む
_ [PFI] はてなブックマークの関連エントリー機能開発そろそろこの日記がプライベートなものなのかパブリックなものなのかの位置づけを考えなくてはいけなくなって来ましたが…。 先日、株式会社はてなの皆さんと共同で開発合宿を行いました。その時の様子はnao... 続きを読む
非公式版twitter検索は勉強会情報や面白いustreamやってないかな?というときに重宝していたのですが、 公式版twitter検索が出来たと聞いたので比較してみた。 ■非公式版で勉強会を検索 ■公式版で勉強会を検索 ↓英語じゃないよ!って言われたので「all langu... 続きを読む
たまには自分の研究紹介 D. Okanohara, K. Sadakane. "An Online Algorithm for Finding the Longest Previous Factors". In the 16th European Symposium on Algorithms. Sep 2008. to appear. [pdf(draft)] この研究では文字列を順々に読んでいったとき、各位... 続きを読む
週3日出社となりました。残りの日はasiajinとかnarabete.comで個人で活動しています / mail: MY-SIRNAME@gmail.com (姓@gmail.com) 新たな画像検索エンジンTinEyeが、希望者によるプライベートベータ公開をアナウンスした。 さっそく申し込んで、アカウントを貰... 続きを読む
Introduction to Information Retrieval 輪読会 7章の復習資料を以下にアップロードしました。http://bloghackers.net/~naoya/iir/ppt/iir_07.ppt7章の前半は、6章に引き続きスコアリングの話題です。Vector space model での内積計算を真面目にやろうとすると... 続きを読む
ちょっと今さら感もある話題ですが、先日やったセミナーで質問が出たりもしたので、ここで一度まとめておきたいと思います。 Q1. なぜ日本では検索エンジンが著作権侵害と言われているの? A1. 検索エンジンでは、著作物を含む他人のウェブ・サイトをコピーして... 続きを読む
関係者各位 プレスリリース 2008年6月9日 株式会社 Preferred Infrastructure =================================== Preferred Infrastructure、関連文書レコメンダ『Hotate』を 朝日新聞社の総合情報サイト「asahi.com」に... 続きを読む
strlen()とmemchr()のSIMD版を作ってみました. 今回は最速よりもお手軽さを重視したのでアセンブリ言語ではなくintrinsic関数を使っています.そのためVisual Studio 2008, gcc 4.xの両方でコンパイルでき32-bit, 64-bit OS上で動作します. WindowsとLinuxで... 続きを読む
Sennaみんな、[Senna-dev 884]のメールは読んだかな!?全文検索エンジンSennaの新しいAPIについての素案がついに公開されました。 今までのAPIのほとんどを刷新するという大改造!劇的ビフォーアフター的API群です(APIの匠)。 んで、この新しいAPI群で何が... 続きを読む
技術を武器に、世界で通用するサービスを作りたい プリファードインフラストラクチャー社長 西川徹氏(後編) 就職はまったく考えていませんでした。それより、自分たちが作った技術を広めていきたい、夢を達成したいという気持ちがありました。無理なら無理な... 続きを読む