[B! RCFile] wlbhiroのブックマーク

wlbhiro id:wlbhiro

RCFileに関するwlbhiroのブックマーク (7)

Blog | Cloudera
wlbhiro 2017/05/22
Hive

TEXT

TextFile
リンク
Hive Training -- Motivations and Real World Use Cases
The document discusses Hive, a petabyte-scale data warehouse system built on Hadoop, developed by Facebook to address challenges related to data growth and query performance. It highlights Hive's architecture, use cases, and how it improves data management and querying through SQL-like interfaces, scalability, and extensibility. The text also covers technical details, performance optimization, and
wlbhiro 2016/11/15
Hive

facebook

RCFile

SEQUENCEFILE
リンク
Apache Hiveの今とこれから
Apache Spark on Kubernetes入門（Open Source Conference 2021 Online Hiroshima 発表資料）
wlbhiro 2016/08/03
Hive

ORCFILE

RCFile
リンク
Blog - LINE ENGINEERING
As of October 1, 2023, LINE has been rebranded as LY Corporation. Visit the new blog of LY Corporation here: LY Corporation Tech Blog
wlbhiro 2016/07/31
Hive

RCFile

TextFile
リンク
TEXTFILE/SEQUENCEFILE/RCFILEのサイズ比較
基本的には以下のエントリーを自分なりに再試・咀嚼したものです。 HDFS and Hive storage - comparing file formats and compression methods - Adaltas Hiveテーブルを作成する際、SequenceFileはTextFileに比べてMapReduce時の処理効率は概ね良くなる傾向にありますが、様々なヘッダー情報が付与されるためファイルサイズ的には若干冗長になります。僕もHiveを触り始めてまだ１ヶ月ちょっとなので色々調べている中、RCFileという、HDFS上でHiveテーブルのように構造化されたデータを扱うのに適したデータ構造がある、という事を知ったので、それぞれ以下３種のデータフォーマットについてデータサイズの比較を行いました。 TEXTFILE SEQUENCEFILE RCFILE ◯前提条件今回試験に使
wlbhiro 2016/07/20
Hive

SEQUENCEFILE

RCFile

Hadoop

Compression

Compare
リンク
Hiveのパフォーマンスチューニングで試した７つのこと - Qiita
Spark, SQL on Hadoop etc. Advent Calendar 2014 - Qiita 10日目の記事です。とあるプロジェクトにて、パフォーマンスチューニングのために実施した７つのことをまとめました。この内容はCloudera World Tokyo 2014でお話しさせていただいた内容を再編したものです。登壇資料 - Hadoopで作る広告分析プラットフォーム登壇の様子 - 国内最大級のHadoop関連カンファレンスに登壇してきました！ ##1.YARNが利用可能なリソースの変更 YARNではMR1と異なりスロットではなくコンテナという概念でリソースが管理されます。以下のパラメータでノードマネージャがコンテナに利用可能なメモリ量、CPU数を変更しました。 yarn.nodemanager.resource.memory-mb yarn.nodemanage
wlbhiro 2016/07/19
Hive

Hadoop

type

Avro

SEQUENCEFILE

RCFile

Parquet

YARN
リンク
Cloudera Standard のご案内 ~ 無償版大幅機能強化のお知らせ | Cloudera Japan
Cloudera は、最大規模の企業があらゆる場所に存在するすべてのデータを信頼性の高い有意義な洞察に変換できるよう支援します。
wlbhiro 2014/12/01
Hadoop
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx