[B! hadoop] [5ページ] showyouのブックマーク

はてなブログ | 無料ブログを作成しよう

オーベルジーヌ実食レポ食べ物の鼻塩塩(未だに通じるのかな) オーベルジーヌというカレーをご存知だろうか都内にあるデリバリー専門のカレー屋で、ロケ弁などで大人気の本格欧風カレーが楽しめるらしいいいな〜いいな〜オブザイヤー都内の奴らはこんな良いモン食ってんのか許せねえよ………

showyou 2011/06/19

HBase
hadoop

リンク

今、仕事でバリバリHiveってのを使ってる。 Hiveってのは、HadoopをRDBMSみたく使えるようにしちまおうぜ、という、facebookさんが作った非常に素敵なフレームワーク。なんとSQLみたいな言語でMap/Reduceを実行出来る。素敵なんだが、正直、中身をきちんと理解して使ってるわけではないので、何をどうしたらどうなる、と言う、勘所が全然分かってない。しかもあんまり文献も無いし、詳しい人もあんまりいないし(Hadoopに詳しい人はいる)。ネットには結構情報はあるけどほとんど英語だし・・・まあ読みゃいいんだが。。。英語よりはJavaのが分かるだろう、と思ってとりあえずソースコードをダウンロードしてきて、読み始めた。 ■知りたいこと・どうやってHiveQLを実行してんのか・HiveQLのクエリをどうMap/Reduceにしてんのか ■使ったバージョン・Hive 0.6

showyou 2011/06/16

hadoop

リンク

mahout/レコメンドシステムの作り方 - PukiWiki

プロジェクトの作成 † mavenを使ってレコメンド・アプリケーションを作成します。最初に、プロジェクトを作成します。 $ mvn archetype:create -DgroupId=sample.recommendApp -DartifactId=recommendApp -Dversion=0.0.1 ↑ pomファイルの変更 † pom.xmlのdependecyに以下の項目を追加します。 <dependency> <groupId>org.apache.mahout</groupId> <artifactId>mahout-core</artifactId> <version>0.2</version> </dependency> <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j-jcl</artifactI

showyou 2011/06/13

リンク

IBM Developer

IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.

showyou 2011/06/13

リンク

Introduction to fuzzy kmeans on mahout

New Approach to Data Analysis System “Tableau + TreasureData” at Tableau User...takaya imai

showyou 2011/06/12

hadoop

リンク

MapReduceのもう一つの使い方 - 急がば回れ、選ぶなら近道

MapReduceというと集計に使うモノという人が多いと思う。なんとなれば、MapReduce＝Hadoop＝ワードカウントの図式になっているからだ。実際、Hadoopを触ってみようという人のほとんどはexampleとしてワードカウントを使うはず。その辺に落ちてるシェークスピアのログでHadoopのexampleを動かした人もおおいはず。ところが実際に業務バッチ的な処理を行うときに、MapReduceの効果的な使い方は別にもある。個人的は、「本当のMapReduceの使いかた」はこっちだと思う。なんということはなくて「組み合わせ計算を高速に行う」だ。ある種の計算では、順序処理でギブアップしてしまうケースの一つに組み合わせの計算がある Node{ List<Node> nodeList value(){ hasNodeList() ? nodeList.traverse(value()

showyou 2011/06/11

hadoop

リンク

Perl で MapReduce - Mahout Frequent Pattern Mining Data - - hamadakoichi blog

最近、Perl も書き始めてみたので、Hadoop 上で分散実行できる Perl での MapReduce 実装を紹介する。大規模データマイニング・機械学習のライブラリ Apache Mahout の Parallel Frequent Pattern Mining の入力データを生成する Perl MapReduce 実装の紹介。 Frequent Pattern Mining 入門 Frequent Pattern Mining (Association Analysis )は、隠されたルールパターンを抽出するアルゴリズム。有名な例としては、1992年のウォルマートのクリスマス商戦で「おむつを買った人は半ダースのビールを買う可能性が最も高い」という頻出ルールを抽出し、商品陳列に活かした売上向上した事例。入門資料：第５回R勉強会＠東京で話してきた - 「R言語によるアソシエーション

showyou 2011/06/11

perl
hadoop

リンク

MongoDBで作るソーシャルデータ新解析基盤

Map/reduce, geospatial indexing, and other cool features (Kristina Chodorow)

showyou 2011/06/11

リンク

1013536’s gists

showyou 2011/06/10

hadoop
pig

リンク

http://blogs.forrester.com/james_kobielus/11-06-06-hadoop_what_is_it_good_for_absolutely_something

showyou 2011/06/10

必須1

hadoop

リンク

http://blogs.forrester.com/james_kobielus/11-06-08-hadoop_future_of_enterprise_data_warehousing_are_you_kidding?cm_mmc=RSS-_-IT-_-945-_-blog_1889

showyou 2011/06/10

必須2

hadoop

リンク

Hadoopは仮想化の流れに逆行するのか？

御徒町＠MultiVersionConcurrentClimber(MVCC) @okachimachiorz1 Hadoopのような分散環境が普通に出てくると、実は逆に仮想化の取り扱いが困ってくるという問題が発生する（というかしてる）。分散ではハードの代替性が高いので、対障害性という意味での仮想化は利用箇所が局所的になる。全面仮想化マンセーはちょっと困ったことになる。 2011-06-09 22:17:20 御徒町＠MultiVersionConcurrentClimber(MVCC) @okachimachiorz1 特に運用側面から見ると、仮想化の位置づけはきわめて有効な部分と、そうでない部分があるのは意識したほうがいいと思う。仮想化の前提がLAMPSであるなら、なおさら分散クラウドでの位置づけは再考した方が良いと思う。前提が違う時は、手当が必要になることが多い。なんとなくそう思う。

showyou 2011/06/10

hadoop

リンク

Pig Tutorial

The Pig tutorial shows you how to run two Pig scripts in local mode and mapreduce mode. Local Mode: To run the scripts in local mode, no Hadoop or HDFS installation is required. All files are installed and run from your local host and file system. Mapreduce Mode: To run the scripts in mapreduce mode, you need access to a Hadoop cluster and HDFS installation. The Pig tutorial file (tutorial/pigt

showyou 2011/06/09

あとで触る

hadoop

リンク

平成２１年度産学連携ソフトウェア工学実践事業（高信頼クラウド実現用ソフトウェア開発（分散制御処理技術等に係るデータセンターの高信頼化に向けた実証事業））事業成果報告書

showyou 2011/06/08

hadoop

リンク

Google Code Archive - Long-term storage for Google Code Project Hosting.

Code Archive Skip to content Google About Google Privacy Terms

showyou 2011/06/08

pigの結果をpythonで受け取るツール

hadoop

リンク

MRUnit(MapReduce用のテストライブラリ)を試す

昨日のHadoopソースリーディング4回目(Hadoopソースコードリーディングまとめ第4回 #hadoopreading)で、 @okachimachiorz1 さんが、MRUnit便利だし使うよね的な事をおっしゃっていて、どんなもんかなと思ってチョロっと自動テストしてみました。【環境】 1. EclipseのMapReduceプラグイン hadoop-0.20.2-eclipse-plugin.jar(Hadoopをインストールしたところのcontribに入ってる)を eclipseのプラグインディレクトリに突っ込んで再起動するとウィザードでMap/Reduce Projectが作れるようになります。 ⇒ Hadoopのインストールディレクトリを指定するとそこにパス通してくれる感じ。 2. JUnit4のjarを落としてパスを通す HadoopのlibにはJUnit3.8しか入っ

showyou 2011/06/05

hadoop

リンク

へ〜たのめも:Riak と Cassandra と HBase、あらまー! - livedoor Blog（ブログ）

2010年05月25日 Riak と Cassandra と HBase、あらまー! Mozilla Blog Riak and Cassandra and HBase, Oh My!の勝手訳。各分散 KVS の特徴が分析されていて興味深い……と思って訳してみた。この無様なタイトルは Google 翻訳による。 Riak と Cassandra と HBase、あらまー! 我々は、SoCorro Crash プロジェクトにおいて HBase との統合を進めているが、その話はちょっと置いておいて、今回はメトリック・チームが巻き込まれている別のプロジェクトについて話をしよう。 Mozilla Labs Test Pilotは、実世界の Firefox ユーザをから集めたデータを分析して、ユーザ・エクスペリエンスを向上させるための実験をしたり、定量的データを集めたりするためのプロジェクトだ。私

showyou 2011/06/03

KVS
hadoop

リンク

Hadoopエンタープライズソリューションセミナー - seikoudoku2000のブログ

Hadoopエンタープライズソリューションセミナー＠秋葉原コンベンションホール　by NTTデータ　に行ったので、そのメモ。（一部のセッションは省略） ◎企業内データへの新しいアプローチ Cloudera CEO Mike Olson Big Data Big Dataは大きな問題。トランザクションや売上履歴だけでなく、webなどから色んなデータが集まってくる。新しい方法でデータを保存し、解析する必要がある。機械学習やデータからパターンの抽出を行いたい。データは指数的に膨大を続けている。これにより、会社は新しいデータとの向き合い方を考える必要がある。 Hadoop導入企業ではノード数が平均四倍になっている。 Hadoop HDFSは統合して、費用をかけずにデータを格納することができる。昔はセントラルの高級サーバにしかできなかった。データを格納しているサーバで解析を行えることが

showyou 2011/06/02

hadoop

リンク

# hbaseworkshop HBase勉強会(第一回)

Tatsuya Kawano @tatsuya6502 HBase勉強会（ワークショップ）は、本日5/20 18:30スタートです。もし参加できなくなってしまった場合は、補欠者のために、参加取り消しのボタンを押してください。 http://t.co/O3zG2Ve #hbase workshop 2011-05-20 09:05:56 Tatsuya Kawano @tatsuya6502 RT @tatsuya6502:【HBase勉強会ご参加のみなさまへ】HBaseドキュメントの日本語訳が、あしたの研サイトにて公開されました。勉強会の前にぜひ読んでおいてください。 http://t.co/rvIF6jI （勉強会の情報: http://t.co/O5V0EZe 2011-05-20 11:32:49

showyou 2011/05/21

hadoop

リンク

はてなブックマーク

タグ

関連タグで絞り込む (28)

hadoopに関するshowyouのブックマーク (129)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス