[B! Hadoop][*あとで] kana321のブックマーク

kana321 id:kana321

Hadoopと*あとでに関するkana321のブックマーク (9)

Amazon Redshiftではじめるビッグデータ処理入門記事一覧 | gihyo.jp
第5回Amazon Redshiftのアーキテクチャ～スケーリングとリストアを試してみよう宮崎真，藤川幸一 2013-06-10
kana321 2015/02/18
Amazon Redshiftではじめるビッグデータ処理入門

ビッグデータ

japan

redshift

*あとで

AWS

あとで読む

amazon

amazon redshift

hadoop

bigdata
リンク
Amazon Elastic MapReduceの使い方─Hadoopより手軽にはじめる大規模計算記事一覧 | gihyo.jp
第8回Amazon Elastic MapReduceのパフォーマンスをモニタリングする小林隆 2011-05-12
kana321 2014/12/22
Amazon Elastic MapReduceの使い方─Hadoopより手軽にはじめる大規模計算

elastic map reduce

hadoop

mapreduce

*あとで

Amazon

aws

emr

あとで読む

cloud

あとで
リンク
Hadoopすらもかなわない!? Amazon Redshiftの破壊力をHapyrus 藤川氏が語る | gihyo.jp
Hadoopすらもかなわない!? Amazon Redshiftの破壊力をHapyrus 藤川氏が語るシリコンバレーで起業し、順調にビッグデータビジネスを展開している日本人ベンチャー企業といえば、Hadoop Conference Japan 2013 Winterでも話題となったTreasure Dataがその筆頭に挙げられます。ですが、Treasure Dataとほぼ同じ時期に西海岸でビジネスをローンチし、現在、国内外の投資家たちから高い注目をあつめるビッグデータベンチャー、それも日本人技術者が創業者である企業が実はもう1社存在します。それが藤川幸一氏率いるHapyrusです。今回、来日中の藤川氏に直接、Hapyrusが現在最も注力するAmazon Redshiftに関するビジネスを中心にお話を伺いました。藤川幸一氏 Redshiftへのデータアップロードを事業の中核に ─⁠─H
kana321 2014/11/30
Hadoopすらもかなわない!? Amazon Redshiftの破壊力をHapyrus

*あとで読む

redshift

Hadoop

Big Data

BigData

aws

amazon

amazon redshift

*あとで

DWH
リンク
DockerでUID分離が実現したらHadoop運用は効率化する――米Altiscaleが開発中
Hadoop環境もDockerを使えば管理が効率化する？ AltiscaleがYARNへの適用を進めている。 Hadoopサービスを手掛ける米Altiscaleは、2014年6月3～5日に開催された「Hadoop Summit」に合わせ、DockerをYARN（Yet-Another Resource Negotiator）に対応させるために同社が進めているプロジェクトをブログで紹介した。 YARNはHadoop 2.0で登場した「次世代Map/Reduce」とも言われるフレームワークで、データ処理とクラスタリソース管理の機能を分離する実装になっている。Map/Reduce以外のアプリケーションの動作に門戸を開くものとして注目を集めている。「Dockerは、現在のハイパーバイザーモデルでは達成できないレベルの効率性で次世代の仮想化を実現できる可能性がある。Hadoop YARNをDock
kana321 2014/06/17
Hadoop環境もDockerを使えば管理が効率化する？ AltiscaleがYARNへの適用を進めている

ITmedia ニュース

Docker

Hadoop

*あとで

後で読む

development
リンク
これまでの汎用サーバとは異なる進化の道を選ぶ。HPの「Moonshot System」
今後4年間で新たに50万台のサーバが導入されるとすると、火力発電1基分もの電力が必要とされる。日本ヒューレット・パッカードは4月19日、この課題に立ち向かう「HPからの重要な発表」として同社の新ラインナップとなるサーバ「HP Moonshot System」を発表しました。 Moonshot Systemは、同社が以前から取り組んできたProject Moonshotから生まれた最初の製品です。今回発表されたMoonshot 1500 ChassisはAtomプロセッサを搭載しストレージやNICも備えた超小型のカートリッジ型サーバを45台収容可能。省電力のサーバを高密度に収容したことで、従来のサーバより80％ものスペース削減、89％の電力削減、97％のケーブル削減になると同社では説明しています。日本ヒューレット・パッカード常務執行役員杉原博茂氏は、異次元の省エネルギーとキャパシティ
kana321 2013/10/17
あとで読む

*あとで

*ITカテゴリ

hp

server

サーバ

インフラ

あとでみる

Hadoop

Cloud
リンク
Clouderaが「SQL-on-Hadoop」のImpala 1.0正式版リリース
Hadoopのディストリビューションベンダとして知られるClouderaは今日、Hadoopのクラスタに対してSQLでの問い合わせを実現するオープンソースソフトウェア「Cloudera Impala」のバージョン1.0を公開しました。製品版は「Cloudera Enterprise RTQ」として販売されます。 Release - Cloudera Ships Impala 1.0: Industry's First Production-Ready SQL-on-Hadoop Solution Clouderaは、Hadoopで構築された大規模な分散データベースに対してSQLで高速に問い合わせが可能になることにより、企業でのデータウェアハウス用途などHadoopでの新たな市場を開拓できるとしています。 MapReduceを使わず独自の分散クエリエンジン Impalaはバッチ処理をベースに
kana321 2013/10/13
Publickey

DB

*あとで

Hadoop

SQL

cloudera

Impala

あとでみる

Publickey

MapReduce
リンク
MongoDBがHadoopとの統合強化。HiveでMongoDBデータへSQL問い合わせ可能、BSONをHDFS上に保存など
Integration of Hadoop and Mongo DB, Big Data’s Two Most Popular Techno logies, Gets Significant Upgrade | 10gen, the Mongo DB company Mongo DB Connector for Hadoopは、Hadoopへの入出力データとしてMongo DBを使えるようにするソフトウェアで、新バージョンでは主に以下の機能が追加されています。 Apache HiveからMongo DBのデータへSQLライクな問い合わせインクリメンタルなMapReduceジョブのサポートによる、アドホックな分析を容易に実現 Mongo DB BSONファイルをHadoop Distributed File System（HDFS）上に保存することで、データの移動を削減これにより以下のようなメリットが
kana321 2013/08/22
*あとで

mongodb

hadoop

Publickey

database

Big Data

tech

IT
リンク
mixi の解析基盤とApache Hive での JSON パーサの活用の紹介 - mixi engineer blog
こんにちは．最近ピクルス作りで精神統一をしている，たんぽぽグループ解析チームの石川有です．このブログではお馴染みのたんぽぽグループですが，"No More 「刺身の上にタンポポをのせる仕事」 - 単純作業の繰り返しで開発者の時間を浪費しないために。"というミッションを持っています．その中で解析チームは，データ解析基盤の構築，データマイニング，データ解析の社内コンサルティングを行ない技術からの改善を担当しています．今回の記事では，mixi における解析基盤について簡単に触れたあと，その基盤における「刺身の上にタンポポをのせる仕事」をどう減らすかの２点について書きます． mixi の解析基盤まずは解析環境について，簡単にお話します．2012-08 現在 mixi では，主な解析用のツールとしては，Apache Hadoop, Hive を利用しています．またあわせて，自分など一部の人は，
kana321 2012/09/04
*あとで

hadoop

Hive

mixi

JSON

Apache

ログ解析

udf

運用
リンク
Hadoopの現実解「バッチ処理」の常識をAsakusaで体得
Hadoopの現実解「バッチ処理」の常識をAsakusaで体得：ビッグデータ処理の常識をJavaで身につける（7）（1/4 ページ） Hadoopをはじめ、Java言語を使って構築されることが多い「ビッグデータ」処理のためのフレームワーク／ライブラリを紹介しながら、大量データを活用するための技術の常識を身に付けていく連載 “ビッグデータ”時代の「バッチ処理」アプリケーション開発というと、システム利用者に一番近い画面系の開発が花形ですね。一方「バッチ処理」というと、何となく地味な感じがしますが、「バッチ処理」は縁の下の力持ち、これがないと、大概のシステムは稼働できません。絶対に必要だけど、影の薄い「バッチ処理」でしたが、“ビッグデータ”への注目度が高まり、大量データを短時間に処理する「並列分散処理バッチ」が活躍する場面も増えてきました。本稿では、並列分散で「バッチ処理」を行う方法につい
kana321 2012/05/29
Java

hadoop

*あとで

Asakusa

ビッグデータ

batch

開発
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx