概要 諸事情でYARNやSparkのWebUIがすぐに見れない、でもEMRのStepがなんか失敗しているのでログを見たい!というときにS3から見る方法。 というかEMRのログで作られる各中身の確認 前提 emr-4.7 Spark 1.6 Hadoop 2.7 ログ出力先にS3の任意のフォルダを指定。 ログディレクトリの構成 cluster EMR clusterはそれぞれIDを持ちます。(例: j-2540JQ2HFN027 ) containers 各Hadoopアプリケーションにおいて、分散環境上に複数のコンテナが立てられます。 各アプリケーションはIDを持ちます。(例: application_10000032000_0001 ) 各コンテナはIDを持ちます。applicationのIDにコンテナ用の通し番号が付いた文字列になります。(例: container_1000003200
![EMRのログをS3/Localから追う - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/184a4d2cd36ac3a5d47a2dc93df5496022b350a3/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9RU1SJUUzJTgxJUFFJUUzJTgzJUFEJUUzJTgyJUIwJUUzJTgyJTkyUzMlMkZMb2NhbCVFMyU4MSU4QiVFMyU4MiU4OSVFOCVCRiVCRCVFMyU4MSU4NiZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnR4dC1jbGlwPWVsbGlwc2lzJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9NzViYjM1ZDgwOWE4ZWNlYjhjNzdjZDQ2ODY1NGI5M2U%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwdXJ5eXl5eXl5JnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1mNzE5MjdjY2JjMjQxM2E1YWUwZjE4YTI0NTYxYmQ1Ng%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D4c0c8e02f52bb0bc7644cb159ebc99d5)