論点は3つに大別される。すなわち、「a.どのようなデータソースをもとにビッグデータをつくるか」「b.どのような処理や機能によってビッグデータを利用するか」「c.ビッグデータの利用からどんな効能を得ることができるか」の3点である。 まず、「a.どのようなデータソースをもとにビッグデータをつくるか」としては、各種のセンサ技術由来データ、「オープン」を標榜するウェブサービスが提示するAPIを介して利用可能な各種データ、自らウェブサイトを運営しているのであれば当該サイトを訪問する利用者のログデータなどが相当する。 このような機械的なデータに加え、営業マンが顧客管理データベースに手入力する内容などもデータソースとなるし、公的機関が公開している大量の統計データなども当然にしてデータソースの一種と言えるだろう。 次に「b.どのような処理や機能によってビッグデータを利用するか」において関連商材・サービスの
Microsoftは、「Dryad」(開発コード名)ファミリーの下で開発を進めている「Windows Server」向けの複数の並列/分散技術のテスト版を外部開発者向けに公開した。 米国時間12月17日付けでWindows HPC Team Blogに掲載された記事で、Microsoftは「Connect」経由でDryad、「DSC」「DryadLINQ」の初のコミュニティテクノロジープレビュー(CTP)を公開すると発表した。 Dryadは、Google「MapReduce」や「Apache Hadoop」に対抗するMicrosoftの大規模分散コンピューティング技術。当初、DryadはMicrosoft Researchのプロジェクトとしてスタートし、小規模なクラスタから大規模なデータセンターまで対応する拡張性のある並列および分散プログラムを作成する方法を開発することを目指していた。Dr
米Yahoo!は、大規模データの分散処理を実現するMapReduceをリアルタイムに行うソフトウェア「S4」を、オープンソースとして公開しました。 MapReduceを実行するソフトウェアとして、オープンソースの「Hadoop」がありますが、Hadoopはあらかじめジョブを定義して投入するバッチ処理を前提としていました。 S4は、データをキーとバリューのペアで構成されるストリームデータとして非同期に受け取ることができ、処理結果もキーバリューのペアで構成されたストリームデータとして出力するようになっているとのこと。 この非同期なストリームデータによる入出力が、リアルタイムなMapReduceを実現するフレームワークとしてのS4の特徴といえます。 リアルタイムなMapReduceで何ができる? リアルタイムなMapReduceにはどのような用途が考えられるのでしょうか? S4の公開を表明したY
NTTデータがクラウドコンピューティング専用のハードウエア「Lindacloud」を自社開発し、10月から販売を開始した。オープンソースソフトウエア(OSS)の分散バッチ処理ソフト「Hadoop」のアプライアンスサーバーや、NAS(ネットワーク接続型ストレージ)などとして販売する。同社のハード事業参入は、前身の日本電信電話公社時代のメインフレーム「DIPS」以来となる。 Lindacloudは、NTTデータが自社で設計した冷却能力の高いサーバーきょう体と、一般的なパソコン用パーツを使って組み立てた。これにより、サーバー冷却に必要な消費電力を削減すると共に、低価格を実現した。 Lindacloudを開発した同社テレコムビジネス事業部第三統括部の角野みさき部長は、「通信事業者向けにHadoopを使ったシステムを開発するなかで、Hadoopに適した低価格サーバーが必要となった。だが、ニーズを満た
業界トップ のエンタープライズ Hadoop 企業 Cloudera に入社しました http://www.cloudera.co.jp/ 今年の6月に、「平成21年度 産学連携ソフトウェア工学実践事業報告書」というドキュメント群が経産省から公表されました。 そのうちの一つに、NTTデータに委託されたHadoopに関する実証実験の報告書がありましたので、今更ながら読んでみることにしました。 Hadoop界隈の人はもうみんなとっくに読んでるのかもしれませんけど。 http://www.meti.go.jp/policy/mono_info_service/joho/downloadfiles/2010software_research/clou_dist_software.pdf 「高信頼クラウド実現用ソフトウェア開発(分散制御処理技術等に係るデータセンター高信頼化に向けた実証事業)」という
If you’re looking for a developerWorks forum — Don't panic! You are in the right place. You are here because specific IBM developerWorks forums, blogs and other Connections content have been decommissioned. This page will help you find the content you are looking for, get answers to your questions, and find a new community to call home. Where am I? You are on the IBM Community area, a collection o
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。広報スタッフの楢崎です。 昨日、「Hadoop Hack Night2」を開催させていただきました。 当選された100名にお集まりいただき、Ustream中継やTwitterでも多くの方にご参加いただきました。ありがとうございました。 第三部、トークセッションの様子 写真左からモデレーター・馮 富久 氏(株式会社技術評論社)、太田 一樹 氏(株式会社プリファードインフラストラクチャー)、大谷 晋平 氏(株式会社電通国際情報サービス)、清田 陽司 氏(株式会社リッテル/東京大学情報基盤センター)、古宮 陽明(ヤフー株式会社)、吉田 一星(ヤフー株式会社) 詳しいレポート記事は、後ほど技術評論社さんの「gihyo.jp」に
3月8日(月)に開催された「gihyo.jp×Yahoo! JAPAN presents "Open TechTalk" Hadoop Hacks Night」。前編では、基調講演のYahoo! ,Inc. Hadoopチーム アーキテクトOwen O'Malley氏のセッション、そして特別講演のヤフー株式会社 R&D統轄本部 吉田一星氏によるセッションをレポートしました。後編では、続いて行われたパネルディスカッションの模様をお届けします。 第3部 パネルディスカッション 最後はOwen氏、吉田氏に加え、田中慎司氏(株式会社はてな)、藤川幸一氏(株式会社シリウステクノロジーズ)、三上俊輔氏(筑波大学)の5名のパネリスト、モデレータ馮富久(株式会社技術評論社)による計6名でのパネルディスカッションです。 勢揃いしたパネラー一同 Hadoopのメリット、用途は? 各自かんたんな自己
多くの有名企業が利用し始めたことから注目を浴びているオープンソースの大規模分散データ処理システム「Hadoop」。 2010年3月8日(月)、六本木ミッドタウンのYahoo Japanにて、Yahoo! ,Inc. Hadoopチーム アーキテクトのOwen O’Malley氏を迎えて「gihyo.jp×Yahoo! JAPAN presents "Open TechTalk" Hadoop Hacks Night」((株)技術評論社・ヤフー(株)主催)が開催されました。 会場の模様 第1部 Owen O'Malley氏のプレゼンテーション 5,000億人ものユーザのデータの解析に威力を発揮 最初のセッションは、Owen氏によるプレゼンテーション。冒頭で、氏がまず述べたのが、「Hadoopはオープンソースであり、開発者が協力して力をあわせてプロジェクトを進めていける」とい
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、TechBlog担当の井野です。 3月8日に開催されたOpen TechTalk「Hadoop Hack Night」についてのレポートをお届けいたします。本イベントは、思った以上に多くの方にご応募いただき抽選とさせていただきました。当日は、当選された100名の方々にお集まりいただきました。ありがとうございました。 さて、本イベントですが、大きく分けて三部構成でお送りいたしましたので、各々ご紹介いたします。本イベントのTwitterハッシュタグ『#hadoophn』も活発にやり取りされておりました。 イベントの詳細は、技術評論社さんの「gihyo.jp」にも掲載されておりますので、 あわせてご覧ください。 Hadoop
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、地域サービス事業部の吉田一星です。 今回は、Hadoopについて、Yahoo! JAPANでの実際の使用例を交えながら書きたいと思います。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 複数のマシンへの分散処理は、プロセス間通信や、障害時への対応などを考えなければならず、プログラマにとって敷居が高いものですが、 Hadoopはそういった面倒くさい分散処理を一手に引き受けてくれます。 1台では処理にかなり時間がかかるような大量のデータも、複数マシンに分散させることで、驚くべきスピードで処理を行うことができます。 例えば、今まで1台でやっていた、あるログ集計処理
ひしだまHPの更新履歴。 主にTRPGリプレイの元ネタ集、プログラミング技術メモと自作ソフト、好きなゲームや音楽です。 Hadoop Hack Night 2に行ってきたので、その感想など。 (今どきノートに手書きでメモしてるもんだから、汚くて読めないので まとめは出来ません(なんて無意味な!(爆))) (のっけから「Hadoop使ったことある人~?」って聞かれると、手を挙げていいのかどうか迷う…試しに擬似分散環境を動かしているだけだから…) ヤフーの吉田さんて、「Hadoopで、かんたん分散処理」を書いた人だそうで。 Hadoopという言葉を初めて聞いてネットで調べていた頃、この記事を見てHadoopに衝撃と本格的な興味を持ったんだよな~。 (自分がなぜHadoopに興味を持ったのかについては、いずれ書きたいネタのひとつ。まぁ誰の役に立つわけでもないだろうけど(苦笑)) ABYSSでは、
1. 技術評論社/ヤフー 共催 Hadoop Hack Night Vol. 2 2010年8月4日 新たな情報インフラとしての Hadoopの活用 株式会社リッテル 上席研究員 清田 陽司 (兼 東京大学情報基盤センター 学術情報研究部門 助教) Twitter: @kiyota_yoji 2. Hadoop活用の壁 • 実績がまだまだ少ない • ○○という機能がない • ファイルシステムとして備えるべき機能(アクセス権制 御など) • マスタサーバの多重化 • Hadoopってよくわからないんだけど • RDBMSとの違いは? • どういう処理でメリットがあるの? • Hadoopってクラウドなの?(←そもそもクラウドって何 よ?)
米Yahoo!は、Apache Hadoopに関連した最新技術「Hadoop with Security」と「Oozie」を発表した。それぞれ認証周りとワークフローエンジンを担うもので、今後はオープンソースプロジェクトとして開発を進めていく。 米Yahoo!は6月29日(現地時間)、分散処理プラットフォーム「Apache Hadoop」に関連した最新技術「Hadoop with Security」と「Oozie」を発表した。Yahoo!は2つの技術をApache Software Foundation(ASF)に移管し、今後はオープンソースプロジェクトとして開発を進めていく。 Hadoopは、米Googleの「MapReduce」と「Google File System(GFS)」に着想を得てはじまったオープンソースプロジェクト。現在、ASFのトップレベルプロジェクトとして開発が進んでいる
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く