タグ

emrとSparkに関するkma83のブックマーク (6)

  • Submitting User Applications with spark-submit | Amazon Web Services

    AWS Big Data Blog Submitting User Applications with spark-submit Francisco Oliveira is a consultant with AWS Professional Services Customers starting their big data journey often ask for guidelines on how to submit user applications to Spark running on Amazon EMR. For example, customers ask for guidelines on how to size memory and compute resources available to their applications and the best reso

    Submitting User Applications with spark-submit | Amazon Web Services
  • EMRでのSparkアプリのトラブルシュート - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 概要 EMR(≒YARN)上で動かすSparkアプリケーションを運用していて、エラーが起きた時にどのようにログを追っていくかを記します。 環境 Hadoop: 2.7 Spark: 1.6 EMR: 4.6 エラーの検知 リトライも成功しなかった場合、EMRのコンソールで失敗が表示されると思います。 (ちなみに経験上、実行時間が30s以内でエラーになったらだいたいstepの記載ミス、60s程度で終わってたらアプリのパラメータミスなどによる初期化の失敗などではと思います。) Sparkアプリの実行においては、いくつかエラーとなりうるところ

    EMRでのSparkアプリのトラブルシュート - Qiita
  • Spark のメタストアとして AWS Glue データカタログを使用する SQL - Amazon EMR

    翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。 Spark のメタストアとして AWS Glue データカタログを使用する SQL Amazon EMRリリース 5.8.0 以降を使用して、 AWS Glue Data Catalog をメタストアとして使用するSQLように Spark を設定できます。永続的なメタストア、またはさまざまなクラスター、サービス、アプリケーション、あるいは AWS アカウントで共有されるメタストアが必要である場合は、この設定をお勧めします。 AWS Glue は、データの分類、クリーニング、強化、さまざまなデータストア間の信頼性の高い移動を簡単かつ費用対効果の高い方法で行えるフルマネージド抽出、変換、ロード (ETL) サービスです。 AWS Glue Data Catalog は、

  • Spark2.0をEMRで試す - Qiita

    概要 一週間前くらいにSpark2.0が出ました。そして、今日確認したらEMR5.0が既にSpark2.0対応されていました。さすがAWSさんです! ということで、Spark2.0でイマドキのSpark実行を簡単にメモしておきます。 ゴール Spark2.0が動く Scala2.11ビルドしたjarが動く Java8で動く YARN分散環境上で動く EMR設定 Software Configurationにて以下のように設定 emr-5.0.0 hadoop2.7.2 Spark2.0.0 configurationに以下のjsonを追加 Java8の設定と、sparkに最適化する設定を行っています。 [ { "classification": "spark", "properties": { "maximizeResourceAllocation": "true" } }, { "Cla

    Spark2.0をEMRで試す - Qiita
  • AWS News Blog

    AWS Week in Review – AWS Documentation Updates, Amazon EventBridge is Faster, and More – May 22, 2023 Here are your AWS updates from the previous 7 days. Last week I was in Turin, Italy for CloudConf, a conference I’ve had the pleasure to participate in for the last 10 years. AWS Hero Anahit Pogosova was also there sharing a few serverless tips in front of a full house. Here’s a picture I […] Amaz

    kma83
    kma83 2015/08/21
    Amazon EMR上でSparkのサンプルを作成するチュートリアル込み
  • Amazon EMR 2.x および 3.x AMIバージョン - Amazon EMR

    翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。 Amazon EMR 2.x および 3.x AMIバージョン AWS は、すべての AWS APIエンドポイントTLSの設定を最小バージョン 1.2 TLS に更新します。Amazon EMR リリース 3.10 以前では、1.0/1.1 TLS 接続のみがサポートされています。2023 年 12 月 4 日以降は、Amazon 3.10 EMR 以下のクラスターを作成することはできません。 Amazon EMR3.10 以前を使用している場合は、ワークロードをすぐにテストし、最新の Amazon EMRリリースに移行することをお勧めします。詳細については、「AWS Security Blog」を参照してください。 AMI バージョン と呼ばれる Amazon E

    kma83
    kma83 2015/08/21
    クラスターの Amazon VPC サブネットを選択する(オプション) - Amazon Elastic MapReduce 社内でEMRからEC2のMySQLに接続できなくて、原因はEMRクラスタとMySQLが異なるVPCを使ってたからというところまで分かった時に調べた情報。
  • 1