タグ

ブックマーク / www.publickey1.jp (13)

  • ビッグデータとは単にデータの量のことではない、データの種類や増加速度に注目せよ。ガートナー

    「ビッグデータ」という言葉が最近よく使われています。Publickeyでも、企業が処理すべきデータがさまざまなログやソーシャルメディアなどから急送に生成されていることなどを指して「ビッグデータ」という言葉をこれまでに利用してきました。 Gartner Says Solving 'Big Data' Challenge Involves More Than Just Managing Volumes of Data ビッグデータとは「Big Data」であり、文字通り巨大なデータを意味していますが、米調査会社のガートナーはビッグデータとは単なる巨大なデータではないのだと、「Gartner Says Solving 'Big Data' Challenge Involves More Than Just Managing Volumes of Data」(ガートナー曰く、ビッグデータへの課題は

    ビッグデータとは単にデータの量のことではない、データの種類や増加速度に注目せよ。ガートナー
  • グーグル、マイクロソフト、Yahoo!、Facebookらが新しいネットワーキング技術の実現へ「Open Networking Foundation」を結成

    グーグル、マイクロソフト、Yahoo!、Facebookらが新しいネットワーキング技術の実現へ「Open Networking Foundation」を結成 サーバの仮想化やクラウドが普及したことで、「サーバを用意すること」の意味が、物理的なサーバを調達することから、サーバのインスタンスを立ち上げることへと変わろうとしています。いまではAPIを叩けば、CPUの性能やメモリ容量を指定し、いくつインスタンスを立ち上げ、いつシャットダウンするのか、すべてAPIから指定できる環境が広まっています。 同じことがネットワークでも起ころうとしています。現在のところ「ネットワークを構築する」こととは、ケーブルを引いてルータやスイッチの設定画面からルーティングやVLANを設定することです。設定されたネットワークは基的にスタティックなものであり、構成を変えるには再びルータやスイッチの設定画面を開いて設定をや

    グーグル、マイクロソフト、Yahoo!、Facebookらが新しいネットワーキング技術の実現へ「Open Networking Foundation」を結成
  • レッドハット、オープンソースによるIaaS基盤「CloudForms」と、PaaS基盤「OpenShift」を発表

    レッドハット、オープンソースによるIaaS基盤「CloudForms」と、PaaS基盤「OpenShift」を発表 オープンソースのパワーをクラウドに投入するとして、レッドハットはIaaSを実現する「CloudForms」と、PaaSを実現する「OpenShift」の一連のソフトウェア製品群を、5月3日から行われたイベント「Red Hat Summit 2011/JBossWorld 2011」で、発表しました。 すでにクラウドを実装するためのオープンソースソフトウェアはさまざまなものが登場しています。IaaSを実現するものとしては、EucalyptusやOpenStack、CloudStackなどがあり、PaaSを実現するオープンソースソフトウェアとしては、VMwareがCloudFoundryを発表しています。 レッドハットの今回の発表は、IaaSとPaaSのスタックを一貫してオープン

    レッドハット、オープンソースによるIaaS基盤「CloudForms」と、PaaS基盤「OpenShift」を発表
  • クラウドに最適化したMySQLのフォーク「Drizzle」が正式版公開

    MySQLからフォークし、クラウド用途に最適化して開発された「Drizzle」が3月15日に最初の正式版を公開しました。 MySQLはよく知られたオープンソースのリレーショナルデータベースです。そのMySQLを、トランザクション機能を維持したままクラウドのような大規模分散環境での並列処理とマルチコアCPUに最適化したのが「Drizzle」です。 多くのWebサービスのバックエンドでは、高速なデータベース処理を実現するために多数のMySQLサーバを用いた分散処理をしていますが、Drizzleではそうした用途に特化して設計されています。 NoSQLに対するSQLからの回答 Drizzleは、大規模なWebサービスのバックエンドデータベースとして利用することを想定しているため、Web系サービスのバックエンドとしてはほとんど使われないだろう機能が省かれています。例えば、ACL(アクセス制御リスト)

    クラウドに最適化したMySQLのフォーク「Drizzle」が正式版公開
  • セールスフォース、無料で使えるクラウドデータベース「Database.com」を発表。Dreamforce '10

    セールスフォース・ドットコムは12月7日(現地時間)、サンフランシスコで行われた同社のイベント「Dreamforce '10」の基調講演で、クラウド上にホスティングされたデータベースサービス「Database.com」を発表しました。 (基調講演の内容については、1つ前の記事「セールスフォース・ドットコム、企業向けマイクロブログ「Chatter」を無料化。フリーミアム戦略へ。Dreamforce'10」を参照してください) Database.comはビジネスアプリケーション向けのリレーショナルデータベースサービス。ブラウザからスキーマを自由に定義でき、障害時の自動フェイルオーバー、普段のバックアップ、ディザスタリカバリなどの運用をすべてクラウドに任せることができます。 しかも3ユーザー、10万件、月間5万トランザクションまでは無料で利用可能。 セールスフォース・ドットコムは、同社が以前から

    セールスフォース、無料で使えるクラウドデータベース「Database.com」を発表。Dreamforce '10
    inak0shi
    inak0shi 2011/02/15
  • MySQL互換クラウドRDBサービス「Xeround」が公開ベータへ

    MySQL互換ながら独自のクラウド対応ストレージエンジンを搭載することで、スケーラブルなクラウド対応データベースサービスを実現する「Xeround」(ゼラウンドと発音するようです)が公開ベータを開始したことを明らかにしました。 Xeround MySQL Cloud Database Now on Amazon EC2 in Europe | Xeround MySQL Cloud Database Blog Xeroundはクラウド上のDatabase as a Service(DBaaS)として提供されるため、インストールやセットアップは基的に不要。無料でベータ公開サービスを利用可能になっています。 MySQL互換のDatabase as a Service XeroundはMySQLのストレージエンジンアーキテクチャの上に構築されており互換性があるため、すでにMySQLを利用してい

    MySQL互換クラウドRDBサービス「Xeround」が公開ベータへ
    inak0shi
    inak0shi 2011/02/15
  • NoSQLとしてMySQLを使うDeNAが、memcachedよりも高速な75万クエリ/秒を実現

    モバゲーで知られるDeNAは、バックエンドデータベースにNoSQLを使っていません。なぜか? それはMySQL/InnoDB 5.1の環境で秒間75万クエリという、多くのNoSQLでも実現できないような高性能を実現しているから。DeNAの松信嘉範(まつのぶよしのり)氏は、自身のブログにこんな内容のエントリ「Using MySQL as a NoSQL - A story for exceeding 750,000 qps on a commodity server」(英語)をボストしています。 Yoshinori Matsunobu's blog: Using MySQL as a NoSQL - A story for exceeding 750,000 qps on a commodity server 松信氏が指摘するように、大規模なネットサービスを提供している企業の多くは分散環境で

    NoSQLとしてMySQLを使うDeNAが、memcachedよりも高速な75万クエリ/秒を実現
  • HBaseとはどんなNoSQLデータベースなのか? 日本語で読める情報を集めてみた

    Facebookが新しいサービス「Messages」の基盤として、NoSQLデータベースの「HBase」を選択したことを、先日の記事「Facebookが新サービスの基盤にしたのは、MySQLでもCassandraでもなく、HBaseだった」で紹介しました。 HBaseは、Facebookによると次のような特徴を備えていると説明されてます。 負荷に対して非常に高いスケーラビリティと性能を発揮 CassandraよりもシンプルなConsistency Model(一貫性モデル)を備えている 自動ロードバランス、フェイルオーバー、圧縮機能 サーバーごとに数十個のシャードを割り当て可能、などなど このHBaseはどのようなデータベースなのでしょうか? 情報を集めてみました。 HBase入門のプレゼンテーション 最初に紹介するのは「HBaseエバンジェリスト」Tatsuya Kawano氏のプレゼン

    HBaseとはどんなNoSQLデータベースなのか? 日本語で読める情報を集めてみた
  • オラクルはクラウド戦略の中でなぜメインフレームのようなマシンに注力しているのか?

    クラウドのインフラストラクチャといえば、安価なコモディティサーバをネットワークによって結んだ分散処理型のアーキテクチャが主流です。Amazonクラウドしかり、グーグルしかり、Windows Azureもしかりです。 しかしそれに逆らうように、まるでメインフレームのようなマシン「Exadata」や「Exalogic Cloud」を発表し、それを「クラウド・イン・ア・ボックス」と名付けてクラウドのインフラストラクチャとして位置づけているのがオラクル(ちなみに日経コンピュータではオラクルの垂直統合を「オープンメインフレーム」と呼んでいます)。 そのオラクルが12月16日、クラウド戦略について記者向けの説明会を日オラクルのオフィスで行いました。説明を行ったのは、米社のプロダクトマーケティング担当グループ バイスプレジデントのロバート・シンプ氏。 オラクルは、コモディティサーバでコスト削減できる

    オラクルはクラウド戦略の中でなぜメインフレームのようなマシンに注力しているのか?
  • SAP、脱オラクルへのロードマップ。インメモリデータベース「HANA」を発表

    業務アプリケーション大手のSAPは、「破壊的テクノロジー」(同社バイスプレジデント 福田譲氏)として、従来のデータベースよりも高速に大規模データ分析を行えるインメモリデータベース「SAP High-Performance Analytics Appliance」(HANA)を発表しました。製品は、パートナーであるIBMもしくはヒューレット・パッカードのハードウェアに組み込まれたアプライアンスの形で提供されます。 HANAの今回のバージョンはデータ分析を主な用途とするOLAPエンジンとして提供されますが、将来のバージョンではOLTP機能も備え、ERPのバックエンドデータベースの用途も想定されています。SAPはこれまでERPのデータベースを事実上オラクルやマイクロソフトに依存していましたが、自前主義へと舵を切ることになります。 インメモリデータベースでOLAPとOLTPを統合 インメモリデータ

    SAP、脱オラクルへのロードマップ。インメモリデータベース「HANA」を発表
  • EMCはなぜアイシロンを買収したのか?

    ストレージベンダ最大手のEMCが、NASストレージベンダのアイシロンシステムズを買収すると、11月15日(米国時間)に正式に発表されました。デルが3PARを買収したときにヒューレット・パッカードが待ったをかけ、最終的にさらっていってしまったことが今年の8月に起こりましたが、今回はそのような波乱もなく、買収は速やかに行われました。 今年後半は3PARの買収、アイシロンの買収と、ストレージ業界での大きな買収が2件も起こりました。それ以外にも、IBMが8月にデータ圧縮技術のStoreWizeを買収、デルも7月にデータ圧縮のOcarina Networksを買収するなど、ストレージ業界では買収が相次いでいます。 なぜ、ストレージベンダ最大手のEMCはアイシロンを買収する必要があったのでしょうか? いまストレージ業界には何が起きているのでしょうか? いくつかの分析をまとめてみました。 EMCの理由は

    EMCはなぜアイシロンを買収したのか?
    inak0shi
    inak0shi 2010/11/30
  • リアルタイムなHadoop? 「Real-Time MapReduce」を実現するS4、オープンソースとしてYahoo!が公開 - Publickey

    Yahoo!は、大規模データの分散処理を実現するMapReduceをリアルタイムに行うソフトウェア「S4」を、オープンソースとして公開しました。 MapReduceを実行するソフトウェアとして、オープンソースの「Hadoop」がありますが、Hadoopはあらかじめジョブを定義して投入するバッチ処理を前提としていました。 S4は、データをキーとバリューのペアで構成されるストリームデータとして非同期に受け取ることができ、処理結果もキーバリューのペアで構成されたストリームデータとして出力するようになっているとのこと。 この非同期なストリームデータによる入出力が、リアルタイムなMapReduceを実現するフレームワークとしてのS4の特徴といえます。 リアルタイムなMapReduceで何ができる? リアルタイムなMapReduceにはどのような用途が考えられるのでしょうか? S4の公開を表明したY

    リアルタイムなHadoop? 「Real-Time MapReduce」を実現するS4、オープンソースとしてYahoo!が公開 - Publickey
  • グーグル、分散処理のためにデザインされた言語「Sawzall」をオープンソースで公開

    グーグルは、同社内でパラレルデータ処理に利用している言語「Sawzall」を、「Szl」というプロジェクト名のオープンソースとして公開しました。 書籍「Googleを支える技術」によると、Sawzallは分散処理のためにデザインされたDSL(Domain Specific Language)で、特定の用途に限っては非常に容易に処理を記述できるようになっているインタープリタ型のプログラミング言語。GFS(Google File System)とMapReduceを基盤とし、MapReduceをより簡単に実行できるものと説明されています。 なぜSawzallはオープンソースとして公開されたのか? グーグルは2003年8月に、論文「Interpreting the Data: Parallel Analysis with Sawzall」を発表し、これによってSawzallという言語がグーグル

    グーグル、分散処理のためにデザインされた言語「Sawzall」をオープンソースで公開
  • 1