[B! hadoop][Apache] Itisangoのブックマーク

Itisango id:Itisango

hadoopとApacheに関するItisangoのブックマーク (15)

メキメキ開発の進む Apache Sparkのいまとこれから（Spark Casual Talk #1 発表資料）
Spark Casual Talk #1 （2015/06/23）発表資料『メキメキ開発の進む Apache Sparkのいまとこれから』 NTTデータ基盤システム事業本部 OSSプロフェッショナルサービス猿田浩輔（Apache Sparkコミッタ）、土橋昌 ※イベントページ http://connpass.com/event/15575/Read less
Itisango 2015/06/24
Apache

spark

hadoop

analytics

NTT

データ

2015年

あとで読む

web

software
リンク
日立がCOBOLデータ向けHadoopアプライアンス
日立製作所は2013年10月15日、COBOLデータをOSSの分散処理ソフト「Apache Hadoop」で活用する「かんたんHadoopソリューション for COBOL基幹データ活用」を、10月17日に販売開始すると発表した（写真）。取引履歴や販売実績など、基幹系のビッグデータ分析が主なターゲットである。同社のブレードサーバー「HA8000-bd/BD10」に、Hadoopや「COBOL2002」「uCosminexus Grid Processing Server」など各種ソフトをインストール／設定して提供する。同社が開発した分散共有ファイル「Hitachi Striping File System（HSFS）」は、「POSIXに準拠したデータ入出力が可能な上に、Hadoopの分散ファイルシステム「HDFS」と互換性がある」（日立製作所プラットフォームサービス開発本部 OSSテク
Itisango 2013/10/15
#COBOL #Apache #Hadoop #日立 #OSS

BD

日立

COBOL

Hadoop

アプライアンス

Apache

2013年

news

COBOL2002

HDFS
リンク
Impalaの挙動及びそのトラブルシューティングについて - Google グループ
Itisango 2012/07/13
CDH

Cloudera

Hadoop

Apache

group

ML
リンク
オープンソースのクローラツール「Apache Nutch 2.0」登場
The Apache Nutch PMCは7日(米国時間)、Apache Nutchの最新版「Apache Nutch 2.0」を公開した。Apache Nutchは、Javaで開発されているハイスケラーブルなWeb検索フレームワーク。Apache Solr、Apache Tika、Apache Hadoop、Apache GoraといったApacheプロジェクトで構築されており、Webクローリング機能やリンクグラフデータベース、HTML解析といった機能を備えている。 Apache Nutch 2.0は小規模なクローラから、Hadoopクラスターでデプロイされた大規模なWebクローラまで、様々なユースケースをカバーできるよう設計されているWeb検索ソフトウェア。Apache Nutch 2.0で構築されたWebクローラは、Apache Accumulo、 Apache Avro、Apach
Itisango 2012/07/12
"Nutchは、Javaで開発されているハイスケラーブルなWeb検索フレームワーク。Apache Solr、Apache Tika、Apache Hadoop、Apache GoraといったApacheプロジェクトで構築されており、Webクローリング機能やリンクグラフデータベース、"

Apache

Nutch

Hadoop

Solr

Tika

framework

クローラ

2012年
リンク
［第6回］クラスターのアーキテクチャー HDFS編
第3回でディストリビューションとディトリビューターや製品ベンダーを詳しく説明しましたが、その後2012年6月に様々なベンダーからApache Hadoop関連製品が新たにリリースされています。米クラウデラは2012年6月5日（現地時間）、Apache Hadoopバージョン2をサポートしたCDH 4.0.0をリリースしました。同じくHadoopのディストリビューターである米ホートンワークスも2012年6月12日（現地時間）、Apache HadoopのディストリビューションHortonworks Data Platform （HDP） 1.0を、Apache Hadoop 1.0.3ベースでリリースしました。このディストリビューションには管理とモニタリングサービスを提供するコンポーネント、Apache AmbariベースのHortonworks Management Center （H
Itisango 2012/07/05
"HDFSとは、グーグルが発表した論文「Google File System」を元にして設計され、Java言語で実装された分散ファイルシステム（Distributed File System）です。"

2012年

Apache

Hadoop

HDFS

分散ファイルシステム

田澤孝之

CDH

HDP

HMC

Ambari
リンク
うるう秒によるjava障害と連動して生じたHDFSメタデータ破損からの復帰手順 - 生物物理計算化学者の雛
※本記事ではうるう秒によるjavaの異常と、それに伴って生じたHadoop 0.21.0 HDFSのメタデータ破損からの復旧手順を説明します。なお、本復旧手順は私の環境で上手くいっただけであり、他の環境で同様の手順を行ったとしても復旧できる保証はありませんので、ご注意ください。昨日（2012/7/1）Hadoopクラスタの一部マシンでCPU負荷が突然MAXに張り付いていることに気付きました。今日になってこの現象はうるう秒のあとにjavaに生じた不具合であることが分かりました（参考：http://d.hatena.ne.jp/sh2/20120702、このブログの記述と同様にjavaとksoftirqdプログラムが大きなCPU負荷を占め続けていました）。この障害が起きていたのはOSがfedora10, 13のマシン群で、他のマシンはCentOSであり不具合無く動作していました。試行錯
Itisango 2012/07/02
"メタデータを過去にコピーしておいたメタデータで差し替えることで復旧することにしました。"

うるう秒

java

trouble

Apache

cpu

Hadoop
リンク
Charming Python: Functional programming in Python, Part 3
IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.
Itisango 2012/07/02
IBM

developerWorks

hadoop

Apache

2012年
リンク
日本IBM、表計算のように分析できるHadoopソフト新版「BigInsights」
日本IBMは2011年8月31日、大量データを分析するシステムをHadoopを用いて構築・運用するミドルウエアの新版「InfoSphere BigInsights Enterprise Edition V1.2」を発表した。新版では、表計算ソフトのようにHadoopデータを分析できる「BigSheets」機能を追加した（写真）。2011年9月2日に出荷する。 InfoSphere BigInsightsは、大量データ分析用の分散処理ソフト「Apache Hadoop」の、IBM版のディストリビューションである。Hadoopシステムを構築・運用するためのツール群を、企業向けにパッケージ化している。Hadoop独自の情報処理プロセス（MapReduce処理）を扱いやすくする上位言語（Jaql、Pig、Hive、その他）、インストーラ、統合開発環境、ジョブスケジューラ、ワークフローエンジンなどを
Itisango 2011/08/31
Apache

Hadoop

IBM

InfoSpheer

BigInsights

enterprise

ミドルウェア
リンク
EMCに訊く、「企業がHadoopを使うためにすべきこと」
EnterpriseZine（エンタープライズジン）編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。
Itisango 2011/07/14
Apache

Hadoop

Enterprisezine

EMC
リンク
いまさら聞けないHadoopとテキストマイニング入門
ビッグデータ時代の救世主「Hadoop」とは「Apache Hadoop」は今、最も注目を集めている技術の1つです。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 Hadoopを活用している企業は年々増え続けていて、不可欠な技術になりつつあるといえるでしょう。本連載では、Hadoopとは何か、Hadoopがどう活用できるのかということを、「テキストマイニング」に焦点を当てて解説していきたいと思います。重い処理を複数のマシンに分散させる複数のマシンに処理を分散させるには、プロセス同士の通信、監視、障害時の対応などを考えなければならず、プログラマにとってハードルが高いものです。しかし、Hadoopはそういった面倒くさい処理を一手に引き受けてくれ、プログラマは、やりたい処理だけに集中できます。例えば、Hadoopを使うと、1
Itisango 2011/06/21
Apache

Hadoop

テキストマイニング

MapReduce

オープンソース

programming

java

tutorial
リンク
Hadoop、hBaseで構築する大規模分散データ処理システム
CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。
Itisango 2011/04/10
hBase

hadoop

mapreduce

Apache

google

file

負荷分散

分散処理
リンク
Hadoop入門とクラウド利用
EDF2012 Kostas Tzouma - Linking and analyzing bigdata - Stratosphere
Itisango 2011/04/10
Apache

hadoop

google

HDFS

MapReduce

amazon

Facebook
リンク
MapReduceのJava実装Apache Hadoopを使ってみた (1/3) - @IT
MapReduceのJava実装Apache Hadoopを使ってみた：いま再注目の分散処理技術（後編）（1/3 ページ）最近注目を浴びている分散処理技術「MapReduce」の利点をサンプルからアルゴリズムレベルで理解し、昔からあるJava関連の分散処理技術を見直す特集企画（編集部） Apache Hadoopプロジェクトとは何か？本特集では、いま再注目の分散処理技術についていろいろと紹介してきました。前編の「GoogleのMapReduceアルゴリズムをJavaで理解する」では、分散処理技術で最近注目を浴びているものとして、グーグルのMapReduceアルゴリズムを紹介し、中編の「イロイロな分散処理技術とイマドキのWebサービス」では、MapReduceに至るまでのさまざまな分散処理技術やWebサービスについて紹介しました。そのMapReduceアルゴリズムをJavaで実装したも
Itisango 2011/04/10
@it

Apache

Hadoop

google

java

mapreduce

db

programming
リンク
Apache Hadoop - Wikipedia
Apache Hadoopは大規模データの分散処理を支えるオープンソースのソフトウェアフレームワークであり、Javaで書かれている。Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。HadoopはGoogleのMapReduceおよびGoogle File System(GFS)論文に触発されたものである。 HadoopはApacheのトップレベルプロジェクトの1つであり、世界規模の開発貢献者コミュニティによって開発され、使用されている。[2] アーキテクチャ[編集] Hadoopは、以下の4つのモジュールによって構成されている。 Hadoop Common: 他のモジュールから共通して利用されるライブラリ群。 Hadoop Distributed File System (HDFS): Hadoop独自の分散ファイルシステム。 Hadoo
Itisango 2010/09/27
Apache

Hadoop

Java
リンク
はてなブログ | 無料ブログを作成しよう
ハリイカの焼売と中華炒めハリイカをよく、見かけるようになりましたよ。生け簀で、泳いでいたものを一杯購入しました立派な大きな墨袋や肝は冷凍保存して柔らかな身は季節のお豆、お野菜と合わせて中華の炒めものに。新鮮なにんにくの茎は刻み、香り高く食欲そそられますね下足はミンチにし…
Itisango 2010/08/01
Apache

Hadoop

ストレージ

ファイルシステム

オープンソース

ネットワーク

インデックス

データ
リンク
1