タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

hadoopとΣ(゚д゚;)に関するkuenishiのブックマーク (2)

  • 管理が困難―分散処理の常識はZooKeeperで変わる

    管理が困難―分散処理の常識はZooKeeperで変わる:ビッグデータ処理の常識をJavaで身につける(8)(1/3 ページ) Hadoopをはじめ、Java言語を使って構築されることが多い「ビッグデータ」処理のためのフレームワーク/ライブラリを紹介しながら、大量データを活用するための技術の常識を身に付けていく連載 分散処理の課題が「管理」なのは常識 複数の計算機上で動作(分散)するアプリケーション、ソフトウェアが多く存在します。分散ソフトウェアは複数の計算機で動作することで大量のデータを扱えたり、高負荷な状況に対処します。稿では、複数の計算機(クラスタ)で動作する各サーバを「インスタンス」と呼びます。 連載で紹介した分散Key-Valueデータベースである「HBase」は複数の計算機で動作する代表的なソフトウェアです。両ソフトウェアはともに「Apache ZooKeeper」(以下、Z

    管理が困難―分散処理の常識はZooKeeperで変わる
  • Hadoop SourceCode Reading 9で発表しました

    先週熱が39.3度まで上がって、夜と朝方に未だに咳が止まらない虚弱なタムタムです。 5/30にHadoop Source CodeReading#9がありまして、「Introduce to Hive undocumented feature」というタイトルで発表させていただきました。 完全にネタセッションになってしまいました。 とはいえ、それなりにHiveは使っていたつもりなので何か困ったことがありましたらご相談ください。 HTTPのサーバは、いったん書き直してそのうちGitHubに公開するようにします。 質問があったtimestampの話ですが、 使わない方が良い理由として、 ・Timezoneの扱いがちょっと微妙 ・UDFのfrom_utc_timestmap, to_utc_timestampがバグってるってレベルじゃない ・一部の処理でメタ情報が正しく扱えない(JDBCからMeta

    Hadoop SourceCode Reading 9で発表しました
  • 1