[B! Hadoop] [8ページ] nobusueのブックマーク

CDHの歴史とCDH5新機能概要 #at_tokuben

＠特勉（＠IT 特集連動勉強会）で発表させていただきました、CDH5についての資料です。 http://atnd.org/events/46924

nobusue 2014/04/09

hadoop
CDH5

リンク

「ビッグデータ」をスマートに処理をする新しい道具、それがオープンソースミドルウエアのApache Hadoop（ハドゥープ）です。このHadoopの力で新たな収益を獲得する企業が増えています。本連載ではこのHadoopを基礎から説明していきます。まず今さら聞けないHadoopの基本、もう一度おさらいしたいアーキテクチャーを解説。分散ファイルシステムの操作とMapReduce処理をコードで確認。ユースケースやクラスタ管理にも言及していきます。2012年に予定されている次期メジャーリリース0.23の情報などの最新トピックも取り込みます。目次

nobusue 2014/04/04

hadoop

リンク

Runtime error - Meta Search

nobusue 2014/04/04

hadoop
Chef

リンク

Runtime error - Meta Search

Error message : Directory is not found or not writable (DATA_DIR) Directory is not found or not writable (DIFF_DIR) Directory is not found or not writable (BACKUP_DIR) Directory is not found or not writable (CACHE_DIR) Site admin: whitestar Copyright © 2006-2023 whitestar. All Rights Reserved. Icons powered by famfa mfam. PukiWiki 1.5.0 Copyright © 2001-2006 PukiWiki Developers Team. License is GPL

nobusue 2014/04/04

リンク

Cloudera Standard のご案内 ~ 無償版大幅機能強化のお知らせ | Cloudera Japan

データを信頼し、AI を信頼する信頼できるデータ、信頼できるモデル、信頼できる AI を実現するために、これほど多くのクラウドのさまざまなデータタイプを管理でき、オープンデータのイノベーションと大規模展開に対応できるプラットフォームは他にありません。

nobusue 2014/04/04

リンク

CDH 5 Installation Guide

nobusue 2014/04/04

hadoop
CDH5

リンク

CDH5 beta1をAnsibleでセットアップ – OpenGroove

先日リリースされたばかりのCDH5 beta1 (Hadoop2.2)を、Ansibleを使ってセットアップしてみた。当初「Vagrant + AnsibleでCDH5をプロビジョニングしちゃおうかな！？」と妄想したのだが、AWSのm1.largeを使うので失敗してやり直したときの経済的打撃が大きいのと、ストライクゾーンが狭すぎて参考にする人まずいないよね…と現実に引き戻され、やめました。 Ansibleでさえ認知度低いので参考にする人がいるかは相当疑問なのだが、ただ構築するだけじゃつまらないので意地でもAnsible使うもんね、みたいなノリである。未来だけを見つめていたいので。Ansibleを使わない場合は、playbookに記載の処理内容をそのままコマンドに当てはめてもらえばいいかと。実行環境として、以下2台のマシンを利用。OSはCentOS 6.4。 Ansible：AWS t

nobusue 2014/04/04

リンク

初めてのHBase一覧

CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

nobusue 2014/04/01

HBase
hadoop

リンク

インテル、過去最大のデータセンター戦略投資でクラウデラの筆頭株主に。Hadoopとインテルアーキテクチャをビッグデータ時代のプラットフォームにすべく

米インテルとHadoopのディストリビューションベンダーとして知られる米クラウデラは、インテルがクラウデラへ出資、インテルがクラウデラの戦略的な筆頭株主となることを発表しました。 Cloudera, Intel Commit to Accelerate and Transf orm How Enterprises Use Big Data; Intel Makes Significant Equity Investment in Cloudera これはインテルにとってデータセンター関連で過去最大の投資。プレスリリースでクラウデラは次のように記し、同社のHadoopディストリビューションをインテルアーキテクチャへ最適化していくと説明しています。インテルは技術やマーケティングの面でこれを支援していくとのこと。 Cloudera will develop and optimize Cloude

nobusue 2014/03/31

リンク

HBase 0.96 で導入される新しいコンパクション「Exploring Compaction」 - 科学と非科学の迷宮

Hadoopアドベントカレンダー2013、3日目を担当する @shiumachi です。今回は HBase 0.96 の新機能を一つ紹介します。要約 HBase 0.96 は賢くなったのでみんな使おう。コンパクションのおさらい HBase では、Log Structured-Merge tree (LSM-tree) というデータ構造を使っています。 LSM-tree を簡単に説明すると、入力されたデータをログとメモリ上のデータストア(Memstore、メモリストア) に書き込みます。メモリストアがいっぱいになると、まとめてディスクにフラッシュし、新しいストアファイルを生成します。このストアファイルがたまってきたときに、少しづつ一まとめにしてなるべくファイル数を少なくするようにします。これがコンパクションです。コンパクションを実行することにより、ファイルは一つにまとまります。こ

nobusue 2014/03/28

hadoop
HBase

リンク

HBaseを止めるな！～OKWaveの挑戦～ - はたらくコンピュータ

2012-12-16 HBaseを止めるな！～OKWaveの挑戦～ HBase Hadoop いまだにHBaseには怖くて手が出せてないんですが、12/10のHadoopソリューションセミナー＠東京カンファレンスセンター品川でのOKWaveさんの事例紹介が素晴らしかったのでご紹介します。この発表を聴いていたら「何とかなるんじゃないか？」という気がしてきました。まず気を付けるポイントは以下の4点 1. リージョン自動分割はしないデフォルトではリージョンが一定サイズを超えると自動分割が走ってしまい、分割中はリージョンにアクセスできなくなる。リージョンは事前に分割しておいて、自動分割閾値を極端に大きい値にしてリージョン自動分割を走らせない方が良い。 2. メジャーコンパクションを走らせないデフォルトでは24h±20%毎に走るけれどもこれだと影響が大きくなってしまうので、そうなる前にこまめに

nobusue 2014/03/28

hadoop
HBase

リンク

『Amebaのログ解析基盤にCloudera ImpalaとPrestoを導入しました』

(この記事は、Hadoop Advent Calender 2013 の12日目の記事です) こんにちは、Amebaのログ解析基盤Patriotの運用をしている、鈴木(@brfrn169)と柿島大貴です。 Patriotについては以下をご覧ください。 http://ameblo.jp/principia-ca/entry-10635727790.html http://www.slideshare.net/cyberagent/cloudera-world-tokyo-2013 今回、Amebaのログ解析基盤PatriotにCloudera ImpalaとPrestoを導入しました。 Cloudera ImpalaとPrestoのインストール方法や詳細ついては、下記URLをご覧ください。 Cloudera Impala http://www.cloudera.com/content/clo

nobusue 2014/03/28

リンク

TwitterがMapReduceストリーミングフレームワークSummingbirdをオープンソースに

Spring BootによるAPIバックエンド構築実践ガイド第2版何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

nobusue 2014/03/21

リンク

日本 OSS 奨励賞を受賞しました

日本OSS推進フォーラムより，第9回日本 OSS 奨励賞を頂きました．ありがとうございます．受賞理由は以下の通りです: Hadoop開発コミュニティにおいて、リソース制御機構YARNの高信頼性を実現する新機能の開発等に貢献するとともに、品質強化に向けた取り組みにも貢献している。若手研究者として論文をまとめる一方で、その知見をもとに、積極的にOSS開発に参画・継続している。受賞者の中には見慣れた名前の方もおり，大変恐縮です．特に @tagomoris 先生，おめでとうございます！同時受賞できるとはびっくりしました．ここ1年の活動内容良い機会なので，ここ1年の活動内容について振り返っておきたいと思います． Apache Hadoop プロジェクトに合計で100件以上のパッチを投稿．マージ件数は14件．恐らく日本人としての投稿・マージ LOC 数はトップ．筑波大学川島先生のお誘いで

nobusue 2014/02/21

OSS
hadoop

リンク

Hadoopの現実解「バッチ処理」の常識をAsakusaで体得

Hadoopの現実解「バッチ処理」の常識をAsakusaで体得：ビッグデータ処理の常識をJavaで身につける（7）（1/4 ページ） Hadoopをはじめ、Java言語を使って構築されることが多い「ビッグデータ」処理のためのフレームワーク／ライブラリを紹介しながら、大量データを活用するための技術の常識を身に付けていく連載 “ビッグデータ”時代の「バッチ処理」アプリケーション開発というと、システム利用者に一番近い画面系の開発が花形ですね。一方「バッチ処理」というと、何となく地味な感じがしますが、「バッチ処理」は縁の下の力持ち、これがないと、大概のシステムは稼働できません。絶対に必要だけど、影の薄い「バッチ処理」でしたが、“ビッグデータ”への注目度が高まり、大量データを短時間に処理する「並列分散処理バッチ」が活躍する場面も増えてきました。本稿では、並列分散で「バッチ処理」を行う方法につい

nobusue 2014/01/25

リンク

Asakusa Framework 勉強会 2014冬 (2014/01/29 19:00〜)

お知らせ connpassではさらなる価値のあるデータを提供するため、イベントサーチAPIの提供方法の見直しを決定しました。2024年5月23日(木)より「企業・法人」「コミュニティ及び個人」向けの2プランを提供開始いたします。ご利用にあたっては利用申請及び審査がございます。詳細はヘルプページをご確認ください。

nobusue 2013/12/13

リンク

halook -Hadoop・HBaseの可視化-

halookとは大量のサーバで構成されるHadoopクラスタの状態把握にお困りではないでしょうか？ halookとは、当社が開発しているWGP、ENdoSnipeを用いて、Hadoop・HBaseの内部を直観的に見える化するツールです。 halookを利用することで、今まで多くの人手と時間が必要だった、問題個所の発見・解決が容易に行えます。 halookでは、HDFSのサーバごとの使用サイズ・空きサイズ、各タスクの状況、HBaseのRegion数などを見える化することができます。 (2012/11/08現在の機能です。) ニュース ■2013/02/05(火) 日経コンピュータにHadoopのシステム開発・運用を容易にする国産OSSツールとして、当社のhalookが紹介されました。 ■2013/01/22(火) 当社の落合が、Hadoop Conference Japan 2013 Wi

nobusue 2013/11/22

これ知りませんでした。。。なにげにすごいな。

リンク

halookで始めるHadoop/HBaseトラブルシューティング記事一覧 | gihyo.jp

nobusue 2013/11/22

とりあえずこれを読もう

リンク

MongoDBがHadoopとの統合強化。HiveでMongoDBデータへSQL問い合わせ可能、BSONをHDFS上に保存など

Integration of Hadoop and Mongo DB, Big Data’s Two Most Popular Techno logies, Gets Significant Upgrade | 10gen, the Mongo DB company Mongo DB Connector for Hadoopは、Hadoopへの入出力データとしてMongo DBを使えるようにするソフトウェアで、新バージョンでは主に以下の機能が追加されています。 Apache HiveからMongo DBのデータへSQLライクな問い合わせインクリメンタルなMapReduceジョブのサポートによる、アドホックな分析を容易に実現 Mongo DB BSONファイルをHadoop Distributed File System（HDFS）上に保存することで、データの移動を削減これにより以下のようなメリットが

nobusue 2013/08/23

リンク

基幹システムをクラウドへあげるのは簡単ではなかった。ノーチラス・テクノロジーズがクラウドの現実を語る（前編）

基幹システムをクラウドへあげるのは簡単ではなかった。ノーチラス・テクノロジーズがクラウドの現実を語る（前編）基幹システムをクラウドで実現する。その過程でどのような技術を用い、どのような苦労があったのか。小売り流通業である西鉄ストアの基幹システムをAmazonクラウド（以下、AWS：Amazon Web Services）の上で実現したノーチラス・テクノロジーズが、その詳細について紹介したセミナーを5月15日、アマゾンジャパン本社のセミナールームで開催しました。大規模システム開発の現状、Hadoopの可能性、クラウドのメリットとデメリットなど、参考にすべき多くの内容が語られたセミナーでした。この記事ではその概要を紹介します。止まってはいけない基幹システムをクラウドへノーチラス・テクノロジーズ代表取締役社長神林飛志氏（写真中央）。西鉄ストア様の本部基幹システムをクラウドへ移行する

nobusue 2013/06/05

リンク

はてなブックマーク

タグ

関連タグで絞り込む (90)

Hadoopに関するnobusueのブックマーク (213)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス