サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
衆院選
w-katsura.hatenablog.com
引き続き、ASCII.technologies 2011年1月号に寄稿した「重複排除技術が革新するストレージの世界」の第二章の技術解説です。今回は「重複の判定方法」です。 [2.2節 重複の判定方法 序文] 今までの説明では重複排除の容量削減効果に主に焦点を合わせてきたが、重複排除技術をシステムに適用するにあたり、それと同じぐらい重要なポイントがある。それは、重複排除処理を加えることによるシステム性能への影響を軽微に抑えるということである。重複排除で容量を大きく削減できたとしても、システム性能が大きく落ちてしまうと使用用途がかなり限定されてしまう。たとえば、バックアップではバックアップウィンドウ以内にバックアップを終了させることは必須なので、性能要件が非常に重要だ。ある程度の性能が出せなければ採用に至らない。 ハードウェアを増強すれば性能低下は抑えられるので、それは重要な要件ではないと考え
引き続き、ASCII.technologies 2011年1月号に寄稿した「重複排除技術が革新するストレージの世界」の第二章の技術解説です。まずは、「重複排除の単位」です。 [第2章 重複排除技術解説 序文] 重複排除のユーザメリットについてここまで説明してきた。本章では、そのメリットを実現するための技術と方式について解説していこう。 重複排除は様々な方式が市場に存在し、どの方式を選ぶかによって効果が大きく変わる。しかし、ベンダーはそれぞれ自分たちの方式の優れた点のみを主張するため、各方式の特性の違いをユーザが理解するのはなかなか難しい。 本記事では、重複排除の各方式の特性の違いを読者に理解してもらうべく、以下の五つのポイントにおいて方式を整理し、それぞれの方式がどういった特性の違いを生むのかについて解説する。重複排除技術を使った製品を比較する際には、この五点について聞けばその特性はほぼ理
ASCII.technologies 2011年1月号に寄稿した「重複排除技術が革新するストレージの世界」を、何本かのエントリに分けて公開させて頂きます。まずは、第一章「重複排除が注目を集める理由」です。第二章の技術解説、第三章の今後の展望に関しては、後日公開する予定です。なお、編集前のテキストを用いていますので、実際の記事と少し差異があります。 [記事序文] 重複排除(Deduplication)という技術を聞いたことがあるだろうか?その名が示すとおり、「データ内に存在するムダな重複部分を排除して一つにまとめてしまう」技術のことで、ストレージシステムを大きく変え得る技術として、市場で大きな注目を浴びている。本記事では、この新技術はなぜそんなにも注目されているのか、技術にはどのような種類があるのか、そして今後どのように発展していくのかなど、重複排除技術の現状と今後の展望について解説する。
重複排除(Deduplication)という技術をご存知でしょうか? 重複排除という名前の通り、「データ内に存在するムダな重複部分を排除して一つにまとめてしまう」技術のことで、米国IT市場でいま最も注目度が高い技術の一つです。 なぜ注目度が高いのか? 注目度が高い理由は、重複排除が非常に大きなコスト削減効果をもたらすからです。 例として、バックアップに重複排除を適用したケースを考えますと、典型的な運用シナリオではデータ容量を約20分の1にまで削減できると言われています(圧縮も併用した場合)。これにより装置コスト、管理コスト、電力コストなどの様々なコストを大きく削減することができます。 ※重複排除についてもう少し詳しく知りたいという方には、手前味噌で恐縮ですが以下のスライドがあります。重複排除技術が出てきた背景から技術概要まで、簡単にまとめております。 JTPAギークサロン12月講演資料―S
最近、Cloud Exchange(クラウド取引市場)という、クラウドリソースを株や穀物の様にマーケットで売買するというアイディアが出てきて、ブログ等で議論になっています。本日は、このトピックを簡単に紹介してみたいと思います。 クラウドリソースはフライトチケットに似ている? クラウドリソースは、実は、ホテルやフライトチケットなどと似た特性を持っています。 それは、「使わないと無くなってしまう」という特性です。 ホテルやフライトは、空き部屋・空席があった場合、それを使わないとそのリソースはそのまま無くなってしまいます(昨日の空き部屋は今日は使えない)。クラウドリソースもその点では同じで、例えば今日空いているサイクルがあったとして、それを使わなければ、そのサイクルは明日には無くなってしまうわけです。 ホテル会社や航空会社は売れ残りをできるだけ避けるためにどうしているかと言うと、需要に応じて価格
先日、「AVATAR製作時、その超巨大データはどのように大陸間転送されたか?」で紹介したAspera社のfaspですが、本日、そのiPhone向け製品が発表になりました。 iPhoneの体感速度を劇的に変える可能性がある面白い製品なので、今日はそれを紹介してみたいと思います。 Aspera社のfaspとは まず、Aspera社のfaspをご存じない方に、概要を簡単に説明します。 HTTP/FTPのトランスポートプロトコルとして使われているTCPは、携帯電話網やWANの様なターンアラウンドタイムの大きい状況では、ネットワーク帯域をうまく使い切れないという弱点を持っています。例えば、パケットロスが発生するとウィンドウサイズが小さくなり、スループットが大きく落ちてしまいます。 Aspera社のfaspは、ターンアラウンドタイムの大きな状況下でも、ネットワーク帯域を効率的に使いきれるところを特徴と
ガートナーが先日、ソーシャルソフトウェアに関する5つの予測を発表しました。とても面白いので、今日はそれをご紹介したいと思います。 以下、一つずつ引用していきます。 By 2014, social networking services will replace e-mail as the primary vehicle for interpersonal communications for 20 percent of business users. (拙訳) 2014年までに、ソーシャルネットワーキングサービスは、20%のビジネスユーザにとってe-mailに変わる人と人の間の主要な通信手段になるだろう。 e-mailからソーシャルネットワーキングサービス(SNS)というのは自然な流れの様に感じますが、2014年という数字を出されてみると迫力がありますね。長い間、嫌われながらも(?)コミュ
渡辺千賀さんのブログで、以下の話を見ました。 仕事のプロになりたかったら | On Off and Beyond 会議でわからないことがあったら、その場で必ず聞く。これは徹底して欲しいあるですよ。 私も、「わからないことがあったら必ず聞く」ということは非常に重要だと思ってます。特に、日本人がアメリカで仕事をする際には。 今日はその話を書いてみます。 多くの日本人は発言を控えることを美徳だと思っている アメリカで日米共同開発をしたときに感じたことですが、日本人は、疑問に思ったことや、自分の考えていることを会議の中できちんと表現せずに、上位者が会議を進めるのをおとなしく見ている方が結構多いのではないかと思います。 後で聞いてみると、理解できていないところがあったり、面白い意見を実は持っていたりします。でも会議ではめったに喋らない。 もちろん、一つには、英語が苦手だということがあるでしょう。しか
先日、幸運にも、私のブログで一つ人気エントリが生まれました。 AVATAR製作時、その超巨大データはどのように大陸間転送されたか? - Wataru’s Blog 現時点で、167 Tweets、151 Bookmarks (Hatena) となっています。こんなにTweetして頂いたのは初めてで、嬉しいです。 しかし、Wataru's Blogのような小さなブログサイトがどのようにしてこんなにTweetを集めることができたのか、恥ずかしながら、自分ではまだよく理解できていません。 そこで、そのメカニズムを少しでも理解すべく、Tweetの増加の軌跡を分析してみようと思いました。分析ツールには、topsyを主に使いました。 分析してみると、三つの段階を経て、そのエントリの人気度が変化していったことがわかりました。 第1段階: 自分で告知するが、全然流行らず(5 Tweets) まず、最初、自
今朝、Twitterを見ていて気になったつぶやきがこちら。もうすぐクラウドのバブルが崩壊するぞ、というつぶやきです(発言者は米国ESGグループのアナリストです)。 @stevedupe: The Great Cloud Collapse is coming - just like the Silly SSP demise of a decade ago. Only legit biz models will survive. VC's will cry. 意訳: クラウドのバブル崩壊が近づいている―10年前に愚かなSSPが消滅したときと同じだ。きちんとしたビジネスモデルを持った者のみが生き残るだろう。ベンチャーキャピタルは悲嘆に暮れるだろう。 これを読んで、先日読んだ記事を思い出しました。似たようなことが書かれていたからです。2010年にクラウドの大惨事が起きて、クラウドの成長が阻害される
本日朝にWebを巡回していたら入ってきたニュースがこちら。 "USPTO Grants Google a Patent On MapReduce" 何と、GoogleがMapReduceの特許を取得とのこと。 MapReduceは、論文が発表され、更にオープンソースクローンであるHadoopが既に世に出ているので、このタイミングで特許が出てくることは多くの人は予想していなかったのではないかと思います。そのためでしょうか、このニュースはTwitterなどで広まり、Hadoopへの悪影響を懸念するコメントが随所に見られました。 そんなとき、GigaOMからよいエントリが。 Why Hadoop Users Shouldn't Fear Google's New MapReduce Patent — Tech News and Analysis Then there is the questio
近ごろ、企業のマーケティング担当者の多くはTwitterアカウントを持っていて、アナリストやプレス、そして顧客に情報発信をしています。Twitterは、優れた双方向コミュニケーション性などいろいろな長所を備えており、マーケティングツールとして今後も広がっていきそうです。 しかし、その反面、Twitterでの情報発信には従来には無かったリスクもあります。今日はそのリスクの一面について書いてみたいと思います。 競合他社による厳しい突っ込み それは、発信した情報に対して、競合他社から厳しい突っ込みがTwitter経由で入るというリスクです。先日、実際にそういったシーンを見てしまいました。 10:49AM chuckhollis: @valb00 why is there no mention of "writes" in any of the NetApp PAM literature? Rea
Glassdoor.comというサイトを知っていますか? 実際の社員たちから匿名で集めた、給与レンジや会社内情に関する情報を見ることができるサイトです。その名の通り、会社の内情をガラス張りにする、会社側にとっては脅威のサイトと言えるでしょう。 興味のある方は、一度ご覧になってみて下さい。米国での給与レンジが丸わかりです。日本のIT企業で働いていらっしゃる方ですと、えっこんなに高いの?と驚かれる方も多いのではないでしょうか。 情報量はかなり豊富です。情報提供をした人だけがデータを自由に参照できるようになっていて、データ見たさに自然と情報が提供されるといううまいサイクルができているようです。もちろん実名を出す必要は無く、匿名で情報提供できます。 社員が選ぶベスト50ランキング さて、本日の主題はここからです。先日、Glassdoor.comにて、社員が選ぶベスト50というランキングが発表されま
昨日のAVATARのエントリでご紹介した、WAN越しにファイルを高速転送することができるAspera社のFASPですが、Amazonクラウド向けに使える製品「Aspera On-Demand for AWS」というのがあるようです。 簡単に調べてみたので、以下、概要を書いてみます。FASPの性能や仕組みについては昨日の記事を参照頂くとして、ここでは課金モデルと使い方について書いてみます。 使った分だけ、という課金モデル 一月あたり$750で使い放題という課金モデルがあります。EC2上に立ち上げるFASPサーバのインスタンス数には制限はなく、いくら立ち上げても構わないそうです。Aspera社のサイトには「$25 per day (or $750 a month)」と書いてあって、もしかしたら一日あたりという使い方も可能かもしれません(恐らく無理だとは思うのですが)。一日あたりが可能なら、ぐっ
JTPAの12月のギークサロンで講演させて頂いたのですが、そのときの資料を、今更ですがSlideShareにアップしました。 題は、ちょっと大袈裟で恥ずかしいのですが「次世代ストレージシステムを語る」です。 ストレージ業界で、いま最もホットな新技術として重複排除(Data Deduplication)とSSDを取り上げ、それらについて解説しています。 JTPA Geek Salon Dec 2009View more documents from watarukatsurashima. ※なお、オリジナルの講演では、DeduplicationとSSDをホットな技術の最上位に挙げている米国企業ストレージ管理者のヒアリング結果のスライドが含まれていましたが、ここでは公開上の制限があり含めていません。 なお、@garyuさんに講演レポートを書いて頂きました。ありがとうございます。
3D映画として現在大ヒットを飛ばしているAVATAR。私の周りでも凄く話題になっていて、IMAXを持つ映画館に近いうちに見に行きたいと思っています。 本日は、AVATAR製作時に使われたITシステムの話を、ご紹介したいと思います。 34ラックという、驚きの超巨大システム AVATARのデータ総容量は、何と、3PB(ペタバイト)!もの大きさだったそうです。毎週、ときには日ごとに数TB(テラバイト)ものデータが出来る上に、それらを色々なフォーマットで保存しなければならないためだそうです。 これだけのデータを処理するために、ITシステムのラック総数は何と34本、そして各ラックには32台のサーバが搭載され、プロセッサ総数は40,000、メモリ合計は104TBに達したそうです。しかも、全てのサーバが10GbEで接続されていたとのこと。 とてつもなく巨大なシステムですね。ここまで来ると小規模なスパコン
引き続き、ASCII.technologies 2011年1月号に寄稿した「重複排除技術が革新するストレージの世界」の第3章、今後の展望です。この記事で、転載は最後になります。 なお、重複排除技術の今後の展望に関しては、近いうちに、より詳しい展望記事を某紙に寄稿予定です。公開が可能になりましたら、またブログで紹介できたらと思っています。 続きを読む 引き続き、ASCII.technologies 2011年1月号に寄稿した「重複排除技術が革新するストレージの世界」の第二章の技術解説です。今回は、「重複排除を行う場所」と「重複排除の範囲」です。 続きを読む 引き続き、ASCII.technologies 2011年1月号に寄稿した「重複排除技術が革新するストレージの世界」の第二章の技術解説です。今回は「重複の判定方法」です。 [2.3節 重複排除するタイミング − リアルタイムか後処理か 序
このページを最初にブックマークしてみませんか?
『Wataru's blog』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く