[B! lucene] sasashinのブックマーク

lucene-gosenのTokenFilterたち | @johtani の日記

一定期間更新がないため広告を表示しています

sasashin 2012/03/07

lucene

リンク

はてなブログ | 無料ブログを作成しよう

ハリイカの焼売と中華炒めハリイカをよく、見かけるようになりましたよ。生け簀で、泳いでいたものを一杯購入しました立派な大きな墨袋や肝は冷凍保存して柔らかな身は季節のお豆、お野菜と合わせて中華の炒めものに。新鮮なにんにくの茎は刻み、香り高く食欲そそられますね下足はミンチにし…

sasashin 2012/02/20

Solr
lucene

リンク

GC改善に役立つ新しいJVMパラメータ | 関口宏司のLuceneブログ

一定期間更新がないため広告を表示しています

sasashin 2012/01/24

Solr
lucene

リンク

デジタルアーカイブシステム DSpace と Alfresco：Cathedral Break in Action：オルタナティブ・ブログ

先日、OSSコンソーシアムの部会で（株）TIS さんから OSSのデジタルアーカイブシステム DSpace を紹介していただきました。デジタルアーカイブというのは、いろんな文化資源をデジタル化して保存し、公開する仕組みで、国家プロジェクトとして多くの美術館や博物館、図書館などで取り組みがなされています。DSpaceはこの仕組みをOSSで実装したもので、すでにかなりの大学や博物館などで実績があるそうです。もともと、ファイルの保管に関する仕組みと言うことで、弊社が扱っている文書管理システム Alfresco と似ている部分があるのでは、と思って参加したわけですが、システムにおいて重視している点がかなり違うことが分かりました。以下、セミナーを聞いて、ぼくの感じたDSpaceのイメージですので、実際のDSpaceの開発思想とは異なっているかもしれないことをご容赦ください。 DSpace 自体

sasashin 2011/12/11

リンク

Scala の REPL から Lucene を試してみる | Atsushi TATSUMA Web Page

はじめに研究室に全文検索機があってもいいじゃないかということで、Lucene を導入しました。そのときに、ちょろっと試す意味で、Scala から Lucene を叩いてみました。 Scala だから特別簡単になるというわけでもないのですが、REPL があるのは、試してみたい時に良いですね。 Lucene のインストール研究室のサーバの OS は全台 Debian squeeze です。 Lucene はパッケージで用意されており、バージョンは 2.9.2 みたいですね。 Debian では Java のライブラリは、だいたい /usr/share/java 以下にインストールされます。 $ sudo apt-get install liblucene2-java インデックス作成ではでは、Scala の REPL からLucene を叩きます。クラスパスで lucene-c

sasashin 2011/11/25

scala
lucene

リンク

TwitterにおけるHadoopとLuceneを利用した大規模データ解析について - nokunoの日記

Twitterについては先日の記事でフロントエンドのBlenderを紹介しましたが、バックエンドやデータ解析のシステムにも興味があります。ちょうどData-Intensive Text Processing with MapReduceで有名な@lintool先生の新しい論文が公開されていたので読んでみました。Full-Text Indexing for Optimizing Selection Operations in Large-Scale Data Analytics(pdf)ACMのMapReduce'11というワークショップで発表された内容のようです。この論文を読んで初めて知ったのですが、Lin先生はサバティカル休暇（大学教授が長期の休みを取れる制度）でTwitterに来ており、データ解析チームで働いているそうです。この論文もTwitter エンジニアの@squarecogさんと