並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 151件

新着順 人気順

impalaの検索結果1 - 40 件 / 151件

  • HadoopのSQL対応分散クエリエンジン「Cloudera Impala」。Clouderaがオープンソースで公開

    HadoopのSQL対応分散クエリエンジン「Cloudera Impala」。Clouderaがオープンソースで公開 Hadoopのディストリビューションベンダとして知られるClouderaは10月25日、SQLに対応し、データの分析速度はMapReduceよりも何倍も高速だという新しい分散クエリエンジン「Cloudera Impala」(製品名「Cloudera Enterprise RTQ」)をオープンソースで公開しました。 これまでHadoopでは内部でMapReduceと呼ばれる処理が用いられていましたが、ImpalaではMapReduceを使わず、Clouderaが2年かけて開発した独自の分散クエリエンジンを用いて処理を行います。Hiveの上位互換のSQLが利用でき、Hive/MapReduceで数分かかっていた応答時間を数秒に短縮すると説明されています。 グーグルのDremel

      HadoopのSQL対応分散クエリエンジン「Cloudera Impala」。Clouderaがオープンソースで公開
    • 『Amebaのログ解析基盤にCloudera ImpalaとPrestoを導入しました』

      (この記事は、Hadoop Advent Calender 2013 の12日目の記事です) こんにちは、Amebaのログ解析基盤Patriotの運用をしている、鈴木(@brfrn169)と柿島大貴です。 Patriotについては以下をご覧ください。 http://ameblo.jp/principia-ca/entry-10635727790.html http://www.slideshare.net/cyberagent/cloudera-world-tokyo-2013 今回、Amebaのログ解析基盤PatriotにCloudera ImpalaとPrestoを導入しました。 Cloudera ImpalaとPrestoのインストール方法や詳細ついては、下記URLをご覧ください。 Cloudera Impala http://www.cloudera.com/content/clo

        『Amebaのログ解析基盤にCloudera ImpalaとPrestoを導入しました』
      • Amazon Elastic MapReduceでニコニコデータセットを使ってHiveとImpalaの速度を比較する。 - Qiita

        Amazon Elastic MapReduceでニコニコデータセットを使ってHiveとImpalaの速度を比較する。hadoophiveImpalaElasticMapReduceEMR EC2安くなる 気がついたら、EC2がだいぶ値下げしていて、我が家の ニコニコデータセットの分析環境のHive利用料も安くなっていた。 参考 【AWS発表】42回目の値下げ!EC2、S3、RDS、ElastiCache、そしてElastic MapReduceも! http://aws.typepad.com/aws_japan/2014/03/aws-price-reduction-42-ec2-s3-rds-elasticache-and-elastic-mapreduce.html 値段の問題もあり、ニコニコデータセット分析環境は、hadoopのバージョン1系でm1.mediumを3台利用して、分

          Amazon Elastic MapReduceでニコニコデータセットを使ってHiveとImpalaの速度を比較する。 - Qiita
        • Cloudera Impala がリリースされました - 科学と非科学の迷宮

          (2012/10/25 15:48 追記) Cloudera 公式ブログで Impala についての紹介記事を掲載しました。このブログ記事の完全上位互換なのでそちらの記事をご参照ください。 Cloudera Impala:Apache Hadoopで実現する、真のリアルタイムクエリ | Hadoopとビッグデータソリューションのリーディングカンパニー | Cloudera Japan Cloudera から、データサイエンティストのためのリアルタイムクエリエンジン「Impala」がリリースされました。Hive と完全互換のクエリ言語で、Hive より10倍以上速くクエリを処理できます。 概要及びダウンロードはこちらから! http://www.cloudera.com/content/cloudera/en/products/cloudera-enterprise-core/clouder

            Cloudera Impala がリリースされました - 科学と非科学の迷宮
          • 凄すぎる!写真を自動でカテゴリ別に分類してくれるiPhoneアプリ「Impala」|男子ハック

            iPhoneおすすめアプリ凄すぎる!写真を自動でカテゴリ別に分類してくれるiPhoneアプリ「Impala」2013年11月13日189 @JUNP_Nです。iPhoneで写真を撮影したはいいけれど、放置しっぱなしでカメラロールの中はグチャグチャという人におすすめしたいiPhoneアプリ「Impala」のご紹介。自動でカメラロール内をカテゴリ分類してくれて超すごいですよ!

              凄すぎる!写真を自動でカテゴリ別に分類してくれるiPhoneアプリ「Impala」|男子ハック
            • Cloudera Impala:Apache Hadoopで実現する、真のリアルタイムクエリ | Cloudera Japan

              データを信頼し、AI を信頼する 信頼できるデータ、信頼できるモデル、信頼できる AI を実現するために、これほど多くのクラウドのさまざまなデータタイプを管理でき、オープンデータのイノベーションと大規模展開に対応できるプラットフォームは他にありません。

                Cloudera Impala:Apache Hadoopで実現する、真のリアルタイムクエリ | Cloudera Japan
              • Cloudera Impala発表資料 | 外道父の匠

                11/26 の『Hadoopソースコードリーディング 第13回』でCloudera Impalaの発表をしてきました。 きっかけはTwitter上で、ビールの化身 も◯す の外道父を呼べば?から始まって、1分かからず依頼ツィートが飛んできて引き受けた感じで、Twitterで数分で全てが完結する非常にフットワークの軽い業界になります。 それでは、発表資料や補足などを書いていきます。 リンク Eventbrite : Hadoopソースコードリーディング 第13回 Twitter #hadoopreading togetter : Hadoopソースコードリーディング 第13回 まとめ Inside Impala Coordinator at HSCR 13th – Go ahead! by @repeatedly Inside Impala -Query Exec Engine- by @o

                  Cloudera Impala発表資料 | 外道父の匠
                • Impala Q&A - still deeper

                  2012/11/7に開催されたCloudera World Tokyoに参加してきました。 本編については他の人がまとめてくれるはずですので省略。 懇親会では米国Cloudera社のCTO、Dr. Amr Awadallah氏に直接Impalaの疑問に答えていただきました。非常に貴重な話を聞けたのでまとめておきます。(公開許可済み) その場でメモを取っていたわけではなく思い出しながらのまとめなので、一緒に聞いていた方、clouderaの方は補足をお願いします。 Q&A Q. なぜJavaでなくてC++で実装したか? A. ImpalaのメインデザイナーがGoogleでC++を使って分散処理(Dremelのこと?)を実装した人物であるのと、JVMの起動コストがレイテンシーの増加につながるため 補足: この人でしょうか Q. 1ノードに偏ったデータを読む必要があるクエリがくると低レイテンシーを

                  • Welcome to Cafe Impala.

                    池澤夏樹の新作『ノイエ・ハイマート』が新潮社から刊行されました! 難民となるのは、どういうことなのか? 誰にでも起こりうる過酷な状況、愚かで冷酷な社会を冷徹に見つめ、人々の良心に寄り添う「新しい故郷(ノイエ・ハイマート)」の物語。 詩と短編とエッセーとがモザイクをなし、書き下ろし、過去 … もっと読む

                      Welcome to Cafe Impala.
                    • Clouderaが「SQL-on-Hadoop」のImpala 1.0正式版リリース

                      Hadoopのディストリビューションベンダとして知られるClouderaは今日、Hadoopのクラスタに対してSQLでの問い合わせを実現するオープンソースソフトウェア「Cloudera Impala」のバージョン1.0を公開しました。製品版は「Cloudera Enterprise RTQ」として販売されます。 Release - Cloudera Ships Impala 1.0: Industry's First Production-Ready SQL-on-Hadoop Solution Clouderaは、Hadoopで構築された大規模な分散データベースに対してSQLで高速に問い合わせが可能になることにより、企業でのデータウェアハウス用途などHadoopでの新たな市場を開拓できるとしています。 MapReduceを使わず独自の分散クエリエンジン Impalaはバッチ処理をベースに

                        Clouderaが「SQL-on-Hadoop」のImpala 1.0正式版リリース
                      • Cloudera Impala #pyfes 2012.11.24

                        Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...MapR Technologies Japan

                          Cloudera Impala #pyfes 2012.11.24
                        • Impala: iPhone内の写真を自動でカテゴリ分けしてくれる。神がかった精度でマジすごい。無料。 | AppBank

                          すごすぎてびびるアプリなんて久々です・・・! Impalaは写真のロケーションや写っている人物を認識し、完全自動で分類してくれるアプリ。 これだけだと「ふーん」と思うかもしれませんが、その精度がすごいのなんのって・・・! 「人物」「外」「室内」なんて簡単ものはもちろん「海」「日の出」「女性」「男性」なんて細かい分類もしてくれちゃうんです!! ごちゃごちゃのカメラロールをできるだけ簡単になんとかしたいと思っていたあなた!このアプリで決まりだから!

                            Impala: iPhone内の写真を自動でカテゴリ分けしてくれる。神がかった精度でマジすごい。無料。 | AppBank
                          • Evolution of Impala #hcj2014

                            2. 2 今日のトピック •  Cloudera Impala とは? •  クエリ言語とユーザビリティ •  メタデータ管理 •  UDF •  リソース管理 •  アドミッションコントロール •  YARN と Llama (ラマ) •  セキュリティ (Apache Sentry) •  パフォーマンスと最適化 •  HDFS •  Parquet •  ロードマップ

                              Evolution of Impala #hcj2014
                            • Impala

                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                Impala
                              • Impalaの挙動及びそのトラブルシューティングについて - Google グループ

                                • Cloudera Impala

                                  大規模並列処理(MPP)エンジンであり、Hadoopのデータに対してSQLを用いてクエリを実行できるソフトウェアImpalaについて紹介する書籍です。ビッグデータのワークフロー全体から、またRDBMS、OS、そしてHadoopといった読者の背景知識を元にして、Impalaが実現する機能や役割を紹介します。なお本書はEbook版のみのリリースとなります。 イントロダクション 1章 ビッグデータのエコシステムにおけるImpalaの立ち位置 2章 ビッグデータのワークフローにおけるImpalaの場所 柔軟性 パフォーマンス 3章 RDBMSの背景知識から見たImpala 標準的なSQL ストレージ、ストレージ、ストレージ 数十億行に及ぶデータ Impalaとデータウェアハウスの相似点 Impalaでの初めてのクエリ Impalaのテーブルへのデータの取り込み 4章 UnixあるいはLinuxの背

                                    Cloudera Impala
                                  • Hadoop用リアルタイムクエリエンジン Impalaのポテンシャルをレビューした

                                    Hadoop用リアルタイムクエリエンジン Impalaのポテンシャルをレビューした:Databaseテクノロジレポート(1/4 ページ) 2012年10月24日に発表されたばかりのHadoop用リアルタイムクエリエンジンをいち早くレビュー。次期CDHに組み込まれる予定の新機能をどう使いこなす? Impalaとは Impalaは、Googleが社内で利用しているDremelとF1にインスパイアされて開発されたオープンソースソフトウェアで、HDFS(Hadoop Distributed File System)あるいはApache HBaseに保存されているデータを対象に、アドホックなクエリを実行するためのツールです。Hadoopのディストリビューションベンダとして有名なClouderaが開発しています*1。 Hadoopファミリのソフトウェアは基本的にJava言語で開発されていますが、Imp

                                      Hadoop用リアルタイムクエリエンジン Impalaのポテンシャルをレビューした
                                    • GedowFatherさんがImpalaを本番投入した件

                                      外道父 | Noko @GedowFather Impalaを本番環境にぶっ込んでやった。ありがちな集計クエリで10倍、ただのカウントで30倍の処理時間差を計測 2012-11-16 11:25:12 外道父 | Noko @GedowFather Impala検証利用データ:17MB, 45,000行 で GROUP & ORDER BY が Hive 63s : Impala 7s。COUNTで Hive 34s : Impala 1s 2012-11-16 11:28:33

                                        GedowFatherさんがImpalaを本番投入した件
                                      • Cloudera impalaの性能評価(Hiveとの比較)

                                        Hadoop MapReduceの処理速度より1桁速いと聞いて、早速自前のクラスタ環境で評価しました。

                                          Cloudera impalaの性能評価(Hiveとの比較)
                                        • Cloudera Impalaのアーキテクチャ

                                          (本ブログは若干古くなっているので、Impala情報ページをご覧下さい。比較的新しい情報をまとめています) 一人アドベントカレンダー25日目、最終日です。 最終日はCloudera Impala(以下Impala)について。Impalaは分散クエリエンジンです。最近EMRでも利用できるようになりました。 Hiveとは何が違うのか、なぜHiveを高速化しなかったのかというような意見もあるようですが、その答えはClouderaの創業者でもあるMike Olsonが今週公開したブログ(Impala v Hive)に詳しく書かれています。かなり興味深い内容ですが、今のところ英語のみです。きっと日本語の記事もいずれ読めるようになるはず。。。 さて、最終日はCloudera Impalaのアーキテクチャについて書いてみます。引用している資料はSlideshareでClouderaが公開しているものです

                                            Cloudera Impalaのアーキテクチャ
                                          • Cloudera Impalaをサービスに組み込むときに苦労した話

                                            1. Cloudera Impalaをサービスに 組み込む時に苦労した話 2014年年10⽉月31⽇日 株式会社セラン RD戦略略室 須⽥田幸憲 @sudabon Copyright © CELL▲NT Corp. All right Reserved. h t t p : / / w w w . x d a t a . j p / 2. ⾃自⼰己紹介 須⽥田幸憲(@sudabon) 株式会社セラン RD戦略略室 室⻑⾧長 経歴 l 1997〜~2004 NEC 中央研究所 / ネットワークの研究 l 2005〜~2006 BIGLOBE / BtoBサービスの開発 SNIP l 2012/8〜~ 現職 Hadoop歴:約2年年半 好きなHadoopエコシステム:Hive 2 Copyright © CELL▲NT Corp. All right Reserved. h t t p

                                              Cloudera Impalaをサービスに組み込むときに苦労した話
                                            • 第17回 Impalaの設計と実装[1] | gihyo.jp

                                              はじめに 今回から3回に渡って、Hadoop上で動作するデータ処理ソフトウェアの1つであるApache Impala(incubating)(以下、Impala)について、以下の流れで説明していきます。 Impala概要(今回) クエリ実行時の並列化の仕組み(第18回) I/O処理における高速化の仕組み(第19回) Impalaの特徴のすべてをお伝えできるわけではありませんが、Impalaの速度に対する取り組みについて参考になれば幸いです。 今回は、Impalaが開発されるに至った背景や特徴、および動作の概要までを紹介していきます。 Impala開発の背景 これまでの連載内でも触れられてきましたが、ImpalaはHadoop上でSQL(正確にはHive Query Language/HiveQL)を高速に処理するために開発された並列データ処理系です。Impala以前から、SQLを実行するH

                                                第17回 Impalaの設計と実装[1] | gihyo.jp
                                              • Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining

                                                Tokyo Webmining #25 で発表したときの資料です。メインはデモの方ですRead less

                                                  Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
                                                • Impalaにファイルで投入したデータはいつから検索可能になるの? - Taste of Tech Topics

                                                  こんにちは。kimukimu(@kimutansk)です。 このエントリはSpark, SQL on Hadoop etc. Advent Calendar 2014 - Qiitaの12/14分です。 多くの人がSQLなら書けるということで、 開発者でなくても自在に検索を定義可能なSQL on Hadoopが今非常に広まりつつあります。 私はそんなSQL on Hadoopの中でImpalaを今使用しているため、Impalaについて書かせていただきますね。 Impalaをデータの集計で使用しているのですが、 その際に「元々存在しているテーブルにデータをファイルで投入する」ことがあります。 ですが、ファイル投入後クエリを実行してみても投入した結果が表示されないことがありました。 かつ、Impalaのサイトを見てもどのタイミングでデータが検索可能になるか、は明確には見つからないんですよね・・

                                                    Impalaにファイルで投入したデータはいつから検索可能になるの? - Taste of Tech Topics
                                                  • Impala概要 道玄坂LT祭り 20150312 #dogenzakalt

                                                    2. 2© Cloudera, Inc. All rights reserved. ⾃自⼰己紹介 •  セールスエンジニア •  2011年年4⽉月にClouderaの最初の⽇日本⼈人社員として⼊入社 •  お客様がCloudera製品を活⽤用できるように⼀一緒に議論論するのがメインの仕 事 • 実際は技術に関係する業務は全部⾏行行っている •  email: sho@cloudera.com •  twitter: @shiumachi 3. 3© Cloudera, Inc. All rights reserved. Hadoop⽤用分析エンジンの要件 複数のユーザによる同時利利⽤用時の性能 思考と同等の速度度で共同作業する 互換性 BIツールやSQLなどの使い慣れたインタフェースが使 えること ユーザビリティ 様々なアプリケーションから連携可能 柔軟性 全てのデータに対し他のHado

                                                      Impala概要 道玄坂LT祭り 20150312 #dogenzakalt
                                                    • Hadoop用クエリエンジン「Impala」がついに一般公開に

                                                      「Hiveの10倍速い」クエリエンジンが一般公開に。最新の列指向データフォーマットなどにも対応している。 Apache Hadoopディストリビューションプロバイダである米Clouderaは、2013年5月1日、HDFS(Hadoop Distributed File System)、HBase向けのデータクエリエンジンである「Cloudela Impala 1.0」の一般公開版をリリースした(ダウンロードサイト)。Impala 1.0の公開と併せて、Impalaの自動管理や技術サポートを提供する「Cloudera Enterprise Real-Time Query(RTQ)」も間もなくリリースするとしている。 Cloudera Impalaは、DremelおよびF1に触発されて開発されたとされるデータクエリエンジン。一般的なデータ形式のほとんどをカバーするほか、列指向のデータフォーマッ

                                                        Hadoop用クエリエンジン「Impala」がついに一般公開に
                                                      • Cafe Impala

                                                        • GitHub - cloudera/Impala: Real-time Query for Hadoop; mirror of Apache Impala

                                                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                            GitHub - cloudera/Impala: Real-time Query for Hadoop; mirror of Apache Impala
                                                          • impala速攻レビュー!!

                                                            米国で開催されている Strata Conf + Hadoop World 2012 で、ついに Cloudera Impala(Public Beta) が発表されました! Impalaとは? Cloudera Impala (http://www.cloudera.com/content/cloudera/en/products/cloudera-enterprise-core/cloudera-enterprise-RTQ.html)はオープンソースのソフトウェアで、一言で言えばリアルタイムクエリエンジンです。Hiveを使っている方やSQLに馴染んでいる方には利用し易いSQLライクなHiveQLを利用して、数秒でHDFSまたはHBaseに格納されたデータを照会できます。 ImpalaはApache HiveのメタデータやHiveQL、ODBCドライバ、Beeswaxを利用します。Hi

                                                              impala速攻レビュー!!
                                                            • Evaluation of cloudera impala 1.1

                                                              This document evaluates the performance of Cloudera Impala 1.1 using two clusters. It finds that RCFile with Snappy compression provides the fastest performance for both Hive and Impala on the clusters for reading-only workloads. Parquet with Snappy may be fastest for larger tables. Issues were identified with memory limits during Parquet table creation and were later fixed. The evaluation shows I

                                                                Evaluation of cloudera impala 1.1
                                                              • 竹をマサカリで叩き割っていくような豪快進行の Tokyo Impala Meetup に参加してきました #impalajp - #garagekidztweetz

                                                                今年熱いトピックのひとつである MPP Query Engine (Rebuild: 52: TLDR Driven Development (Naoya Ito)でも取り上げられてたし)の一角、 Impala を実際に使っている方が一堂に会するという素晴らしい会が開かれるということで、今日は Tokyo Impala Meetup 2014.10 - connpass に参加してきました。 ちなみにわたし自身は Impala を運用はしていないのだけれども、やはりトレンドは追っておきたいというモチベーションで参加してきました。 Cloudera World Tokyo 2014 | Cloudera Japanが来週開催される前哨戦のようなとても熱い、内容の濃い会でした。というわけで来週のそのCloudera World Tokyo 2014 | Cloudera Japanも当然楽しみ

                                                                  竹をマサカリで叩き割っていくような豪快進行の Tokyo Impala Meetup に参加してきました #impalajp - #garagekidztweetz
                                                                • Tame Impala - Feels Like We Only Go Backwards (Official Video)

                                                                  Listen to 'The Slow Rush' now: https://TameImpala.lnk.to/TheSlowRushID Listen to more Tame Impala: https://TameImpala.lnk.to/TameImpalaID See Tame Impala on Tour: https://tameimpalalive.com/ Subscribe to Tame Impala’s YouTube channel: https://TameImpala.lnk.to/YouTubeID Follow the Complete Tame Impala Playlist on Spotify: https://TameImpala.lnk.to/StreamingID https://www.tameimpala.com/ #TameImpa

                                                                    Tame Impala - Feels Like We Only Go Backwards (Official Video)
                                                                  • HiveとImpalaのおいしいとこ取り

                                                                    1. Copyright © CELLANT Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / 1 1 HiveとImpalaのおいしいとこ取り 『プログラミング Hive』『Hadoop 第3版』 刊行記念 Hadoopセミナー 2013年年7⽉月24⽇日 株式会社セラン R&D戦略略室  須⽥田幸憲 3. Copyright © CELLANT Corp. All Rights Reserved. h t t p : / / w w w . c e l l a n t . j p / v 須⽥田幸憲(@sudabon) v 株式会社セラン  R&D戦略略室  室⻑⾧長 v 経歴 l 1997〜~2004  NEC  中央研究所  /  ネットワークの研究 l 2005〜~2006  B

                                                                      HiveとImpalaのおいしいとこ取り
                                                                    • Hadoop Conference Japan 2014 #hcj2014 でImpalaがPrestoより19倍速いという話をしてきた - 科学と非科学の迷宮

                                                                      Evolution of Impala #hcj2014 from Cloudera Japan タイトルとスライドの通りです。 Hadoop Conference Japan を運営された皆様、本当にお疲れさまでした。 また、私のセッションに参加して話を聞いていただいた皆様、ありがとうございました。 朝のキーノートで「使用しているコンポーネント」で Impala がランクインしていて実は結構驚きました。まだまだ普及していないと思っていましたけど、意外と使われているようでうれしいです。 (後 Hue がランクインしているのにも驚いた) 今回は他のSQLエンジンのセッションの間に挟まれての講演だったので、これは気を抜けないなと思い、結構頑張ってスライドを作りました。 やっぱり調べてみると Impala はとても面白くて、機能の細かい部分などを見て新たな発見もたくさんすることができました。 I

                                                                        Hadoop Conference Japan 2014 #hcj2014 でImpalaがPrestoより19倍速いという話をしてきた - 科学と非科学の迷宮
                                                                      • impalaのメモリ管理 - Qiita

                                                                        Cgroupとは? cgroup(control group) Control Group、Linux Containerの紹介 Control Groups (cgroups) cgroupsとしばらく一緒に過ごしてみた Performance Prediction and Optimization using Linux/cgroups Redhat カスタマーポータル:3.7. memory memory.limit_in_bytes ユーザーメモリーの最大値 (ファイルキャッシュを含む) を設定します。単位が指定されていない場合、その値はバイト単位と解釈されますが、より大きな単位を示すサフィックスを使用することが可能です (キロバイトには k または K、メガバイトには m または M、ギガバイトには g または G)。 root cgroup を制限するのには、memory.li

                                                                          impalaのメモリ管理 - Qiita
                                                                        • HBase×Impalaで作るアドテク�「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer

                                                                          GMOインターネットグループのアドテク・サービスの一つ「GMOプライベートDMP」。GMOアプリクラウドのインフラにCDHのHadoopエコシステムを構築しました。コア・テクノロジーとしてのHBase×Impala活用事例と、システム設計についてご紹介します。Read less

                                                                            HBase×Impalaで作るアドテク�「GMOプライベートDMP」@HBaseMeetupTokyo2015Summer
                                                                          • Impala

                                                                            Apache Impala is the open source, native analytic database for open data and table formats. Follow us on Twitter at @ApacheImpala! Do BI-style Queries Impala provides low latency and high concurrency for BI/analytic queries on the Hadoop ecosystem, including Iceberg, open data formats, and most cloud storage options. Impala also scales linearly, even in multitenant environments. Unify Your Infrast

                                                                            • How to install Cloudera Impala (Beta) on Debian | 外道父の匠

                                                                              Hiveより数倍、数十倍速いとの触れ込みに触発され、Cloudera Impalaに挑戦してみました。『Debianには入らないよ』と明記されているだけあって、一度は挫折記事を書き始めたりしつつ、忍耐と閃きで乗り切ったインストール記録になります。 とても良いネタなのでCDH3ユーザは早くコッチにおいでと手招きしておきたいと思います。 リンク集 お師匠さんの記事に綺麗にまとまっています。 続)Cloudera Impala 情報 – Tech Blog 続)Cloudera Impala 情報(2) – Tech Blog 続)Cloudera Impala 情報(3) – Tech Blog 環境 Debian Squeezeで、CDH4.1.0 を利用しています。 HiveのmetadataはMySQLで動いている前提です。 失敗した手順 様々な手順を試しましたが、結局、王道で成功しまし

                                                                                How to install Cloudera Impala (Beta) on Debian | 外道父の匠
                                                                              • Apache Impalaパフォーマンスチューニング #dbts2018

                                                                                2. 2 © Cloudera, Inc. All rights reserved. 嶋内 翔 (しまうち しょう) テクニカルエバンジェリスト 兼シニアセールスエンジニア お客様にとって最適なデータ分析基盤の提案をする仕事をして います 主な担当業種: 金融業界 主な専門分野: 分析データベース 略歴 2006年、NEC入社。OSS推進センターでOSSの基盤についての 基礎を学ぶ。 2011年、Cloudera入社。サポートエンジニアとして、日本のお 客様の技術問い合わせに回答していく傍ら、Hadoopの啓蒙活 動に務める。 2015年から現職。 自己紹介 3. 3 © Cloudera, Inc. All rights reserved. Clouderaは 現在は不可能なことも、データの力によって 近い将来可能になると信じています Apache Hadoopの 信頼できるリーダー企業

                                                                                  Apache Impalaパフォーマンスチューニング #dbts2018
                                                                                • 第18回 Impalaの設計と実装[2] | gihyo.jp

                                                                                  はじめに 今回は、ImpalaのSQL処理の高速化において重要な役割を占めるクエリ処理について説明します。 Impalaのクエリ処理の特徴 Impalaは、MapReduceやSparkをはじめとする既存の手続き型のデータ処理エンジンを使用せず、アドホックなSQLクエリの処理の高効率化に焦点を置いた設計と実装が特徴です。たとえば、結合方法を見てみると、MapやReduceもしくはMapReduceジョブなどのブロッキングオペレータ(第16回)を組み合わせていく処理エンジンにおいては、Impalaにおけるパイプライン結合処理などを実現することは必ずしも容易ではありません(第8回「Impala/Prestoにおける結合処理」⁠)⁠。 また、MapReduceやSparkでは中間データをディスクに書き込むことにより高い耐障害性を実現しますが、Impalaでは耐障害性を多少犠牲にしてメモリ上で処理

                                                                                    第18回 Impalaの設計と実装[2] | gihyo.jp