タグ

2009年4月6日のブックマーク (3件)

  • いま分散システムが面白い理由 - Blog by Sadayuki Furuhashi

    最近 クラウド という単語が流行していますが、「大規模な計算資源を低コストで提供してくれるトコロがあるらしいので、自前で持っていた計算資源を委託しちゃえば運用する手間も知識も要らないし、そもそもサーバーを買う費用を省けちゃうから嬉しい」という発想に基づいているらしく、しかし技術的には 大規模な計算資源を低コストで構築する技術 がポイントでしょう。 大規模な計算資源をどうやって安く構築するか。 従来は、システムの能力を高めるためには、高性能・高機能(それゆえ高価な)マシンを導入するというスケールアップの手法が採られていたのだが、この手法では10倍に性能を上げるために、たとえば30倍のコストがかかるかもしれない。スケールアップと比べてスケールアウトでは、導入したコストにほぼ比例して、パフォーマンスの向上が見込める。 『UNIX magazine 2009年4月号』 p.31 *1 何百万円もす

    いま分散システムが面白い理由 - Blog by Sadayuki Furuhashi
  • 2-8(岡野原)

    6.テーマ概要 ITの急速な進化の中,ますますデータの効率的な保存方法,転送方法が必要とされている.そうした中,実際のデータの内容により自然に即した「単語」という塊を抽出して圧縮するという方法を開発するがこのプロジェクトの目的である.ここでいう単語というのは自然言語における単語ではなく,データの中で塊として見られるあらゆる形での単語を意味する.最終的には,これを用いた圧縮ソフトを開発するのが目的だが,ここでは,そのメインとなる単語抽出アルゴリズム (Word eXtraction,WX法) についての研究開発を行なう. 例えば,abracadabraというデータに対して,ここで開発するプログラムはabraという単語を抽出する.abraという単語を抽出する際に,文の実際的な意味はまったく利用せず,確率情報や,エントロピーなどを計算し,どれだけその単語が周りから「浮き出ているか」,「抽出す

    y_yanbe
    y_yanbe 2009/04/06
  • 長文日記