Reliable, high-performing, highly available enterprise storage
図書館の図書は何らかの特徴別にグループ分けしており、新聞の紙面は総合、社会、経済、国際、生活、料理、スポーツ、地域などに分けられている。図書は図書館の管理者が、新聞の紙面は編集者たちがグループ分けしている。しかし、インターネット上の大量のテキストを何らかの特徴別にグループ分けする場合、すべての内容を読み、グループ分けすることは現実的ではない。また、人為的にグループ分けすることは読む側の主観の印象や認識などに左右されるため、客観的なグループ分けが求められている。 本稿では、テキストがどのグループに属するかに関する情報(外的規準とよぶ)を用いずにグループ分けする方法を説明する。このようなグループ分け方法をクラスター分析と呼ぶ。テキストのクラスター分析は、主に次のようなアプローチ多用されている。 (1)個体の特徴の情報に基づいて、平面や立体空間上で散布図を作成し、分布状況からクラスターの形成状況
クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基本的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.
24時間止められないシステムの多くは,HAクラスタリング・ソフトが活用されています。従来,こうしたシステムはUNIXサーバーで構築されていましたが,近年,Linuxサーバーも使われるようになってきました。それに伴い,Linuxサーバー用のHAクラスタリング・ソフトが増えてきています。 Linuxサーバーのクラスタリングは,現状では商用のHAクラスタリング・ソフトが多く利用されています。代表的なソフトには,サイオステクノロジーの「LifeKeeper」,NECの「CLUSTERPRO」,ヒューレット・パッカードの「ServiceGuard」などがあります。 また,データベース管理システムやアプリケーション・サーバーなどがHAクラスタリング・ソフト相当の機能を自前で持っている場合もあります。これらの機能を利用する際には,HAクラスタリング・ソフトは不要となります。ただし,提供される監視機能など
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く