日本語で書かれたウェブ上のテキストを巨大な例文集(コーパス)とみなし、それを検索します。JReK(ジェイレック)は、 日本語のウェブページのテキストを 巨大な例文集(コーパス, Corpus)とみなし、 それを検索するサイトです。 日本語作文の際に役に立つかと思います。 JReK is a Japanese web corpus search site. It is usefull for learners of Japanese!
最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めの本です。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン
●Googleキラーとも言われる「Mahalo」を徹底的に使ってみた RWWなどで、検索エンジン「mahalo」が注目されていました。そこで色々調べてみました。 参考:Hitwise Intelligence - Heather Hopkins - US: Wikia Launch & Mahalo Growth 参考:Believe it or not, Mahalo is Growing - ReadWriteWeb 参考:人力が加わった検索エンジン「Mahalo」 :ソーシャルメディア.jp(自己言及) このmahaloというのは「Googleキラーか」と騒がれたこともある検索エンジン。最近、ユーザ数が増えているそうで。賛否両論のAlexaで調べてみると確かに増えているようです。トラフィックランクは3,449位。 » mahalo.com(Alexa) そこで個人的に思うに、Maha
Explore Recent Photos Trending Events The Commons Flickr Galleries World Map Camera Finder Flickr Blog Prints The Print Shop Prints & Wall Art Photo Books Get Pro Pro Plans Stats Dashboard Get Auto-Uploadr Log In Sign Up Log In Explore Trending Events The Commons Flickr Galleries Flickr Blog The Print Shop Prints & Wall Art Photo Books Get Pro About Jobs Blog Advertise Developers Guidelines Help H
統合型メタ検索エンジンの役目は終えました・・・ ロボット型のニュース検索エンジン Ceek.jp News を大幅にアップデートしました! 学術文献のソーシャルメディアでのインパクトを計測する Ceek.jp Altmetrics をリリースしました
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く