最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めの本です。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン
Re: 25 Year old BSD bug Subject: Re: 25 Year old BSD bug From: Terry Lambert <email@hidden> Date: Tue, 13 May 2008 14:51:02 -0700 On May 13, 2008, at 8:30 AM, Andre-John Mas wrote: Hi, I came across this article this morning, by way of Gizmodo, and though it might be of interest for the list, since it also apparently effects MacOS X: http://osnews.com/story/19731/The-25-Year-Old-UNIX-Bug The code
デル株式会社は5月13日、AMD Opteronプロセッサを搭載した仮想化対応サーバー「PowerEdge R805/R905」を発表した。同日より販売を開始する。あわせて、ITシステム導入・更新を支援する「アセスメントサービス」に、ストレージ・アセスメントサービスを新たに追加することも発表した。 R805は、クアッドコアOpteronおよびデュアルコアOpteronを最大2基搭載可能な2Uサイズのラックマウントサーバー。最大の特長は、仮想環境構築で必要となるメモリやI/Oを同クラスの既存製品と比べて倍増している点。DDR2 SDRAMに対応したメモリスロットを16基用意しており、最大128GBのメモリを搭載可能。I/Oスロットでは、Gigabit Ethernetポートを4つ、PCI Expressスロットを4つ搭載。2008年下半期には、10Gigabit Ethernet対応ポートに
株式会社日立システムアンドサービス(以下、日立システム)は5月13日、独EXASOLが開発した次世代データウェアハウス(DWH)・エンジン「EXASolution」の日本語対応版を、9月1日から出荷すると発表した。 EXASolutionは、高速の検索性能を実現するインメモリデータベース(DB)。独自のインメモリDBMSと並列処理の技術により、TPC(Transaction Processing Performance Council)が公表したベンチマークで、世界最速に輝いた製品という。 複数のサーバーを並べることで、それぞれのメモリ空間を共有。インメモリDBMS技術でメモリ上での検索処理を可能にしているのが特長。また、データを分散配置することで、並列処理による高速化を実現している。単純にサーバー数を増やすことで性能アップが図れる上に、高価な専用ハードウェアを用意する必要はなく、汎用のイ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く