[B! Hadoop][hadoop] [5ページ] nobusueのブックマーク

オライリーのHadoop関連本リリース予定 (2014/8時点)

最近、米O’ReillyからHadoop関連書籍の出版予定が目白押しです。リリース予定がわかりにくいので、表にまとめてみました。 ※2015/1/8補足: 最新情報は別ページにまとめました Hadoopをエンタープライズで利用したい方は必読ですね。（ちょっとリリースラッシュで積ん読になりそうなところが怖いです）もちろん、日本語に翻訳されるのも楽しみです 🙂 NoTitleRelease date和書名出版日雑感

nobusue 2014/09/06

Hadoop

リンク

Cloudera Blog

The ongoing progress in Artificial Intelligence is constantly expanding the realms of possibility, revolutionizing industries and societies on a global scale. The release of LLMs surged by 136% in 2023 compared to 2022, and this upward trend is projected to continue in 2024. Today, 44% of organizations are experimenting with generative AI, with 10% having […] Read blog post

nobusue 2014/09/05

mapとmapPartitionsの違いは重要

Spark
Hadoop

リンク

HadoopのファイルシステムとしてS3を利用する

EC2でHadoopを使う場合、インスタンスを停止するとデータがなくなる（EBSを使うという手もありますが）関係でデータはS3に置く場合が多いと思います。その場合、S3からEC2上のHDFSに読み込んでから処理をして最後にS3に書き出すということも考えられますが、やはりS3上のファイルを直接Hadoopのジョブ入出力として使うのが効率が良い。（更に言うと、複数のジョブを実行する時の中間のデータを保存するのにはHDFSを使った方が速い）そもそもHadoopはファイルシステムの部分を抽象化していて、HDFSもその実装の一つに過ぎません。 AmazonS3 – Hadoop Wikiにもありますが、S3を使うための実装には2種類あるので注意。 S3 Native FileSystem (URI scheme: s3n) 普通にS3上のファイルを読み書きするネイティブファイルシステム。H

nobusue 2014/08/25

Hadoop
aws

リンク

AmazonS3 - Hadoop Wiki

S3 Support in Apache Hadoop Apache Hadoop ships with a connector to S3 called "S3A", with the url prefix "s3a:"; its previous connectors "s3", and "s3n" are deprecated and/or deleted from recent Hadoop versions. Consult the Latest Hadoop documentation for the specifics on using any the S3A connector. For Hadoop 2.x releases, the latest troubleshooting documentation. For Hadoop 3.x releases, the la

nobusue 2014/08/25

DistCpコマンドでHDFS<->S3の双方向コピーが可能

リンク

Hadoop Oozie設定からPigのPythonUDFを利用するまでのまとめ - Y's note

Hadoop 第2版作者: Tom White,玉川竜司,兼田聖士出版社/メーカー: オライリージャパン発売日: 2011/07/23メディア: 大型本購入: 9人クリック: 182回この商品を含むブログ (24件) を見る Oozie OozieとはHadoop MapReduceのジョブ管理システムの事でMapReduceの定期処理化や複数のMapReduceの実行し結果を一つにまとめるなど一連の処理フローとして定義することができる優れものです。Oozie自体はJava/Tomcatで作られているようです。Oozieを動かすために開発者は以下のものを用意しなければなりません。ファイル必須記述方式用途設置場所 MapReduceプログラム必須 Java,Streaming,Pig/Hive等 MapReduce実行 HDFS workflow 必須 xml OozieJo

nobusue 2014/08/25

Oozie
Hadoop

リンク

Cloudera Blog

The ongoing progress in Artificial Intelligence is constantly expanding the realms of possibility, revolutionizing industries and societies on a global scale. The release of LLMs surged by 136% in 2023 compared to 2022, and this upward trend is projected to continue in 2024. Today, 44% of organizations are experimenting with generative AI, with 10% having […] Read blog post

nobusue 2014/08/24

hadoop

リンク

Hadoop REST API – WebHDFS

nobusue 2014/08/24

リンク

WebHDFSメモ(Hishidama's Hadoop WebHDFS Memo)

概要 WebHDFSは、HTTP（REST API）を使ってHDFSを操作するインターフェース。（HttpFSのようなプロキシーサーバーではない。→tagomorisさんのHoop(httpfs)とwebhdfsの違い）対応バージョンはHadoop1.0.0（CDH3u5）以降。リンク whitestarさん WebHDFS tagomorisさん 2012-01-02 Hoop(httpfs)とwebhdfsの違い 2012-06-04 CDH4b2におけるWebHDFSとHttpFsについて 2012-06-05 WebHDFSとHttpFsについての簡単なベンチマーク 2012-08-14 CDH3u5でWebHDFS 2012-08-20 WebHDFSとHttpFs(Hoop)に見るHDFSクライアントチューニングの話三上俊輔さん WebHDFSの性能評価外道父さんタ

nobusue 2014/08/24

リンク

HadoopDfsReadWriteExample - HADOOP2 - Apache Software Foundation

Simple Example to Read and Write files from Hadoop DFS Reading from and writing to Hadoop DFS is no different from how it is done with other file systems. The example HadoopDF SFileReadWrite.java reads a file from HDFS and writes it to another file on HDFS (copy command). Hadoop FileSystem API describes the methods available to user. Let us walk through the code to understand how it is done. Before

nobusue 2014/08/24

hadoop
HDFS

リンク

A HDFSClient for Hadoop using the native JAVA API, a tutorial

nobusue 2014/08/24

hadoop
HDFS

リンク

「Hadoopを40分で理解する」のスライド公開！

(2014/12/10追記）Hadoop入門になりそうなブログをまとめたページを作成しました。-> Hadoopを10分で試す Cloudera World 2013の資料が公開されました先週開催されたCloudera World Tokyo 2013、資料が公開され始めました。 http://www.cloudera.co.jp/cwt2013-session.html まだ全てのスライドは揃っていませんが、順次公開されるとのこと。「Hadoopを40分で理解する」のスライド(pdf)もダウンロードできるようになっています。スライドシェアにも上げてあります。 #cwt2013

nobusue 2014/08/21

hadoop

リンク

GitHub - sequenceiq/cloudbreak: Cloudbreak is a cloud agnostic Hadoop as a Service API. (Please use https://github.com/hortonworks/cloudbreak)

nobusue 2014/08/19

リンク

HugeDomains.com

Captcha security check sequenceiq.com is for sale Please prove you're not a robot View Price Processing

nobusue 2014/08/19

リンク

Hadoop-as-a-Service APIのCloudbreakが公開ベータへ

Spring BootによるAPIバックエンド構築実践ガイド第2版何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

nobusue 2014/08/19

hadoop

リンク

Resources | MongoDB

Expanding LLM Applications: From RAG to Agentic Systems 11 A.M. ET Are you ready to advance your AI application development skills? Join us for an exciting webinar that bridges the gap between large language model (LLM) applications, Retrieval-Augmented Generation (RAG), and the exciting domain of agentic systems. In this comprehensive session, Staff Developer Advocate Richmond Alake will explore

nobusue 2014/08/18

リンク

GitHub - mongodb/mongo-hadoop: MongoDB Connector for Hadoop

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

nobusue 2014/08/15

リンク

Cloudera Standard のご案内 ~ 無償版大幅機能強化のお知らせ | Cloudera Japan

データを信頼し、AI を信頼する信頼できるデータ、信頼できるモデル、信頼できる AI を実現するために、これほど多くのクラウドのさまざまなデータタイプを管理でき、オープンデータのイノベーションと大規模展開に対応できるプラットフォームは他にありません。

nobusue 2014/08/08

リンク

Hadoopの「開発企業」へと進み始めたNTTデータ

オープンソースソフトウエア（OSS）の分散データ処理ソフト「Hadoop」を使ったシステム構築やサポートの事業を手がけるNTTデータ。そんな同社が現在、Hadoopのサポート企業から「開発企業」へと変わり始めている。Hadoopのソースコード開発に関する貢献を増やし、Hadoopの「コミッター」を自社から輩出することを目指す。「Hadoopの開発そのものに、今まで以上に足を突っ込むことに覚悟を決めた」。NTTデータの濱野賢一朗氏は、同社のHadoopに関するスタンスをこのように表現する。NTTデータは2010年7月から、Hadoopを使ったシステム構築・運用支援サービスを手がけている。NTTデータは当初、Hadoopのディストリビューション（検証済みパッケージ）のベンダーである米クラウデラと提携し、サポートを提供していた。例えば、ユーザー企業からHadoopに関するバグ修正などの要望が生

nobusue 2014/08/05

hadoop

リンク

MapReduceは「ゆっくり死んでいく」、Hadoop開発者のカッティング氏

オープンソースソフトウエア（OSS）の分散データ処理ソフト「Hadoop」が、大きな変貌を遂げ始めている。バッチ処理だけでなく、SQLクエリーを使ったインタラクティブ分析やインメモリー処理、機械学習処理などへと適用領域を広げているからだ。Hadoopのオリジナル開発者であるダグ・カッティング氏は、「新しい時代が始まった」と語る。現在のHadoopの状況をどのように見ているか？同じような機能を備えたコンポーネントが複数提案されるなど重複はあるが、技術開発は非常に高速に進んでいる。（米Apacheソフトウエア財団が2013年10月に正式版をリリースした）スケジューラーの「YARN」によって、（Hadoopのストレージシステムである）「HDFS」の上に、様々なテクノロジーを共存できるようになったことが大きい。私が特に驚いているのは、（DAG：Directed Acyclic Graph＝有向

nobusue 2014/08/04

Sparkの上に乗るエコシステムにチャンスがあるね

hadoop
Spark

リンク

ビッグデータを支える人々

ビッグデータを収集し、保管し、処理するための技術は、日々進化している。オープンソースソフトウエア（OSS）の分散データ処理ソフトウエアである「Hadoop」のオリジナル開発者であるダグ・カッティング氏をはじめとするビッグデータ技術の開拓者達に、ビッグデータ技術の最新動向を聞いた。 KDDIが採用した分散ストレージ「Cleversafe」、特徴は「誤り訂正符号方式」米シカゴに本拠を置くクレバーセーフ（Cleversafe）は、数ペタバイト（PB）を超えるようなビッグデータを保管できる「オブジェクトストレージ」のベンダーだ。同社の「Cleversafe」は、日本ではKDDIがクラウドサービス「au Cloud」のストレージ基盤に採用する。クレバーセーフの社長兼… 2014.08.08 「RedshiftはHadoopキラーになる」、FlyDataの藤川氏に聞く藤川幸一氏がシリコンバレーで起

nobusue 2014/08/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (89)

Hadoopとhadoopに関するnobusueのブックマーク (212)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス