[B! Hadoop] [10ページ] yassan0627のブックマーク

Distributed data stores in Hadoop ecosystem

yassan0627 2019/02/13

リンク

HDFS Router-based federation

1. © 2018 NTT DATA Corporation 2018/7/20 技術革新統括本部システム技術本部鯵坂明 HDFS router based federation 2. © 2018 NTT DATA Corporation 2 本日紹介するセッション • HDFS router based federation • Microsoft, Uberの共同発表 • 資料: https://www.slideshare.net/Hadoop_Summit/hdfs-router-based-federation • HDFS BoF 3. © 2018 NTT DATA Corporation 3 従来のNameNode Federation • HDFSクラスタを複数束ねて、1つのHDFSクラスタに見せるための仕組み • NameNodeの限界を緩和するために、開発され

yassan0627 2019/02/13

NameNode Federation：HDFSクラスタを複数束ねて、１つのHDFSクラスタに見せるための仕組み。NameNodeの限界をこれで緩和これの新しい仕組みである HDFS Router Based Federation（HDFS RBF）

hadoop
hdfs

リンク

Hadoop -NameNode HAの仕組み-

2. 自己紹介 ■所属/氏名 - JBSテクノロジー株式会社 - 権田祐樹 (Yuki Gonda) ■略歴 ※2018/06現在 - Linux歴 9年 (運用保守3年、構築6年) - 某通信会社のサーバ構築自動化など - Hadoop歴 4カ月 - Hadoopの構築/運用/保守(150台規模) - HDPのバージョンアップに向け準備中！ ■趣味 - 写真 (Canon EOS 7D所有) - 映画 (昔は年間100本くらい…) - 読書 (月1冊程度)

yassan0627 2019/02/13

hadoop

リンク

Hadoop -ResourceManager HAの仕組み-

Hadoop (主に ResourceManager、NodeManager) についての基礎知識があり、ResourceManager HA について詳しく知りたい人向けの内容となっています。Read less

yassan0627 2019/02/13

hadoop

リンク

Resource Management in Impala - StampedeCon 2016

yassan0627 2019/02/12

リンク

Hiveによるデータの洗い替え処理の検証 - kanga333.b?log

yassan0627 2019/01/30

hadoop
hive

リンク

NTTデータのHadoop報告書がすごかった - 科学と非科学の迷宮

業界トップのエンタープライズ Hadoop 企業 Cloudera に入社しました http://www.cloudera.co.jp/ 今年の6月に、「平成２１年度産学連携ソフトウェア工学実践事業報告書」というドキュメント群が経産省から公表されました。そのうちの一つに、NTTデータに委託されたHadoopに関する実証実験の報告書がありましたので、今更ながら読んでみることにしました。 Hadoop界隈の人はもうみんなとっくに読んでるのかもしれませんけど。 http://www.meti.go.jp/policy/mono_info_service/joho/downloadfiles/2010software_research/clou_dist_software.pdf 「高信頼クラウド実現用ソフトウェア開発（分散制御処理技術等に係るデータセンター高信頼化に向けた実証事業）」という

yassan0627 2019/01/30

リンク

grepコマンドをHadoop Streaming上で実行する | DevelopersIO

S3上に大量に存在するログファイルをgrepコマンドで検索したいと思ったことがある方は結構いらっしゃるのではないでしょうか。今回はHadoop Streamingを利用してS3上のファイル群に対してgrepコマンドを実行したいと思います。 Hadoop Streamingの概要については以下をご参照下さい。 EMRでHadoop Streamingジョブを実行する実行環境 emr-5.5.0 でアプリケーションは Hadoop のみハードウェア構成は m1.medium を 1 台（検証用なのでマスターノードのみ）東京リージョン EMRクラスタの作成まずはEMRクラスタを作成します。AWS CLIを利用する場合は以下のようなコマンドになります。SubnetId, log-uriを自身の環境に合わせて書き換えて下さい。 aws emr create-cluster --auto-sc

yassan0627 2019/01/23

リンク

【レポート】Deep Dive: ビッグデータワークロードをAWSに移行する #reinvent #ABD312 | DevelopersIO

【レポート】Deep Dive: ビッグデータワークロードをAWSに移行する #reinvent #ABD312 原題 ABD312 - Deep Dive: Migrating Big Data Workloads to AWS 概要 Customers are migrating their analytics, data processing (ETL), and data science workloads running on Apache Hadoop, Spark, and data warehouse appliances from on-premise deployments to AWS in order to save costs, increase availability, and improve performance. AWS offers a br

yassan0627 2019/01/23

リンク

ヤフーにおけるHadoop Operations #tdtech

yassan0627 2019/01/21

ヤフーにおけるHadoop Operations #tdtech　自動化とか考えたら無課金CDHより #Ambari の方が良いのかなぁ。統合されたらAmbariどうなるんだろ。。。

リンク

Top 5 Hadoop Courses for Big Data Professionals — Best of Lot | HackerNoon

yassan0627 2019/01/19

リンク

GitHub - apache-spark-on-k8s/kubernetes-HDFS: Repository holding configuration files for running an HDFS cluster in Kubernetes

yassan0627 2019/01/18

リンク

HDFS vs. Cloud Storage: Pros, cons and migration tips | Google Cloud Blog

With the recent merger of Hadoop companies Cloudera and Hortonworks, some are asking: Is the Hadoop file system officially dead? The news around this merger has reiterated the impact of the economics of cloud. Reports are now going as far as saying that using cloud storage can easily “crush Hadoop storage costs.” Object stores such as Google Cloud Storage are overtaking on-premise Hadoop Distribut

yassan0627 2019/01/18

リンク

Migrating HDFS Data from On-Premises to Google Cloud | Cloud Architecture Center

yassan0627 2019/01/18

hadoop
gcp

リンク

Hadoop-3.2.0の新機能の紹介とJava9+対応のコミュニティ動向

2018年11月19日開催された第25回Hadoopソースコードリーディングで発表した資料です。Read less

yassan0627 2019/01/15

#hadoopreading

hadoop

リンク

Looking back at Spark 2.x and forward to 3.0

Kazuaki Ishizaki presented on improvements to Spark from versions 2.x to 3.0. Some key probl ems in Spark 2.x included slow performance due to excessive data conversion and element-wise copying when working with arrays. Spark 3.0 aims to address these issues by improving the internal data representation for arrays and eliminating unnecessary serialization. Ishizaki was appointed as an Apache Spark

yassan0627 2019/01/15

#hadoopreading

hadoop
spark

リンク

第25回 Hadoopソースコードリーディング「HBase 最新情報」

2. ⾃⼰紹介鈴⽊俊裕(すずきとしひろ) • Apache HBase Committer • Hortonworks • Sr. Software Engineer, Breakfix • サポートチームで働いています • エスカレーションされたサポートチケットのトラブルシューティング • プロダクトのバグフィックス(主にHBase/Phoenix) • 著書「HBase徹底⼊⾨」 • Twitter: @brfrn169 5. HBase 2.0 • 2018年4⽉末にリリース • 4年前に2.0のブランチが作られた • 安定させるのに1年以上かかった • hbase-2.0.0 released, April 29th, 2018 • hbase-2.0.0-beta2 released, March 22nd, 2018 • hbase-2.0.0-beta1 releas

yassan0627 2019/01/15

#hadoopreading

hadoop
hbase

リンク

Hiveでarray、struct型などをNULLにする方法 - MicroAd Developers Blog

こんにちは。マイクロアドでサーバーサイドエンジニアをしている大澤です。今回はApache HiveでComplex型(ARRAY, STRUCT, MAP, UNION)を使用している際に発生した問題と解決方法について紹介します。問題の内容 Hive上に下記の様なテーブルが存在する場合を想定します。 CREATE TABLE example_table ( column1 INT, column2 STRUCT<field:INT>, column3 ARRAY<INT> ); Primitive型は暗黙にNULLが変換されるので下記の様なクエリでは特に問題は起きません。 INSERT INTO example_table SELECT NULL, NAMED_STRUCT("field", 1), ARRAY(1); ただ、Complex型は各カラムの定義がテーブル定義と完全に一致す

yassan0627 2019/01/13

Hive
hadoop

リンク

HiveServer2

2. Hive Evolution • Original • Let users express their queries in a high-level language without having to write MapReduce programs. • Mainly target to ad-hoc queries. • As a data tool, usually work in CLI mode. • Now more … • A parallel SQL DBMS that happens to use Hadoop for its storage and execution layers. • Ad-hoc + regular • As a service … 3. Introduction • Limitations of HiveServer1 • • • •

yassan0627 2019/01/08

Hive
hadoop

リンク

Java9でsun.misc.Cleanerのpackageが移動してしまうことへの対処(Apache Hadoopの場合) - Qiita

概要 JDK9では、JDK-8148117などによって、sun.misc.Cleanerがjdf.internal.ref.Cleanerに移動してしまった。JDK9だけで動かす前提なら単純にimport文を書き換えれば良いが、JDK9とJDK8の両方でビルドを通したい場合は黒魔術的な対処が必要になる。以下、この黒魔術について解説する。目的 [HADOOP-12760]sun.misc.Cleaner has moved to a new location in OpenJDK 9をなんとかしたい詳細問題となっているコード /** * Unmaps the block from memory. See munmap(2). * * There isn't any porta ble way to unmap a memory region in Java. * So we use th

yassan0627 2018/12/24

hadoop

リンク

はてなブックマーク

タグ

関連タグで絞り込む (141)

Hadoopに関するyassan0627のブックマーク (288)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス