[B! MapReduce] raimon49のブックマーク

raimon49 id:raimon49

MapReduceに関するraimon49のブックマーク (41)

この10年のプログラミング言語の変化 - 西尾泰和のScrapbox
@nishio: あ、そうか、10年前からあったけど10年間の間に勢力を拡大したケースがあるからあんまり厳しく切らない方がいいのか(TypeScriptの登場が2012年、Rustの登場が2010年だった)
raimon49 2023/01/14
MapReduce

PackageManagement

Reactive

design

network

programming

非同期

歴史
リンク
The History of Distributed Databases - Google, Amazon, Facebook など巨大企業による分散データベース技術の発展 | Wantedly Engineer Blog
こんにちは、Wantedly の Infrastructure Team で Engineer をしている南（@south37）です。今日は、WANTEDLY TECH BOOK 5 から「巨大企業による分散データベース技術の発展」という章を抜粋して Blog にします。「WANTEDLY TECH BOOK 1-7を一挙大公開」でも書いた通り、Wantedly では WANTEDLY TECH BOOK のうち最新版を除いた電子版を無料で配布する事にしました。Wantedly Engineer Blogでも過去記事の内容を順次公開予定であり、この Blog もその一環となっています。 Wantedly における Go 導入にまつわる技術背景 | Wantedly Engineer Blog （本記事は Go Conference 2019 Autumn にて無料配布した冊子『WANT
raimon49 2020/07/25
AWS

Facebook

Google

MapReduce

design

study

あとで読む
リンク
MongoDBの様なNoSQLに勢いがあるのは何故ですか？SQLと比べてどんな利点や欠点がありますか？ - Quora
回答 (3件中の1件目) ハイプサイクルという概念をGartnerグループが提唱してまして、様々な流行りスタリのサイクルを分析する標準的な方法となっています。ハイプとは過度な期待や熱狂を意味する言葉です。一発屋芸人の人気のカーブみたいなもので、テツandトモみたいに安定する場合と、消えていくものがあります。芸人ではありませんがDA PUMPは一茶の人間性もありまして、次は厳しいけど定着すると思っています。なんだかのトリガーで評価が上がり始め、ピークを迎える。その後評価が下がっていき、底を打つと少し上がって定着するという経過をたどるとしています。これと同じモデルで、流行りのハイテク...
raimon49 2018/08/25
MongoDBで役に立ったのはパフォーマンスでなく機能だった、という実体験。2018年現在はMySQL/PostgreSQLでJSONが保存できる。分かり易い整理。

DB

Hadoop

JSON

MapReduce

MongoDB

PostgreSQL

Redis

SQL

algorithm

performance
リンク
「Hadoopの時代は終わった」の意味を正しく理解する - 科学と非科学の迷宮
Hadoopの時代は終わった、という言説をたまに見かけるようになりました。もちろん終わってなどいません。しかし、Hadoopとその取り巻く環境が変化したのは事実です。本記事では、この変化が何なのかを明らかにし、その上で、なぜHadoopの時代は終わったという主張が実態を正しく表していないのかを説明していきます。 DISCLAIMER 私はHadoopを中心としたデータ基盤を取り扱うベンダー、Clouderaの社員です。中立的に書くよう努めますが、所属組織によって発生するバイアスの完全な排除を保証することはできません。以上をご了承の上、読み進めてください。要約データ基盤は、Hadoopの登場により非常に安価となり、今まででは不可能だった大量のデータを取り扱えるようになりました。 Hadoopは、NoSQLブームの中、処理エンジンであるMapReduceとストレージであるHDFSが
raimon49 2017/07/10
MapReduceとHDFS、それぞれのポジショニング。処理エンジン部分のMapReduceはSQLライクな処理エンジンやSparkの登場で役目を終えつつある。

Hadoop

MapReduce

PostgreSQL

Spark

cloud

storage

歴史
リンク
Rebuild: 127: Post-mature Optimization (omo)
Hajime Morita さんをゲストに迎えて、f.lux, Michael Stonebraker, GitHub, JIRA, 高速化などについて話しました。 Show Notes Facebook admits that its app is draining your iPhone's battery 意見を持つ iOS 9.3 f.lux Sherlock Twilight Night Light mode in Google Play Books Readings in Database Systems, 5th Edition Michael Stonebraker dear-github: An open letter to GitHub from the maintainers of open source projects JIRA vs GitHub issues
raimon49 2016/01/19
優先度順にMapReduceジョブを殺して再開させるGoogleのスケジューラー話とクラスタ別になってるHadoopとの違いや、GitHub issuesの話が面白い。

CI

Git

Hadoop

JavaScript

JIRA

MapReduce

Spark

monitoring

notification

performance
リンク
分散システム処理モデルに関する動向について（MapReduceからBorgまで）
詳細については後述しますが、MapReduceの処理モデルは、上記の通り各区分ごとにそれぞれ単純化（限定）されたモデルであったと言えます。また、MapReduceの関数プログラミングおよびグラフ的な特徴も合わせて以下に整理してみます。関数プログラミング的な特徴 MapおよびReduceフェーズは、それぞれ関数型プログラミングのMapおよびReduce処理をモデル化したものです。MapReduceは、参照透過性がある純粋な関数処理と言えます。参照透過性とは入力により出力が一意に決まる性質のことです。言い換えればMapReduceの処理は、大域などの処理に影響する外部の環境は持たず、内部的にも静的な一時変数などの状態も持たないことを意味します。純粋な関数処理は複数の処理が同時に実行されても他の並列に動作している処理の状態には左右されないため、この参照透過性は並列化に向いている性質がありま
raimon49 2015/06/10
MapReduce

SQL

design

study

歴史

あとで読む
リンク
GitHub - google/mr4c
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
raimon49 2015/06/08
C

Google

Java

JSON

MapReduce

cpp
リンク
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向（オープンソースカンファレンス 2015 Tokyo/Spring 講演資料）
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向（オープンソースカンファレンス 2015 Tokyo/Spring 講演資料）
raimon49 2015/03/02
Hadoop 2 YARNによるリソース管理の詳解

Hadoop

MapReduce
リンク
“キャッシュ”が新しいRAMとなる | POSTD
これは Defrag 2014 の講演内容です。テクノロジに長く従事することの（数少ない）利点の1つは、いくつもの技術サイクルの始めから終わりまでを見ることができるということです。いかにしてブレークスルーが実際に広まるかを見られるのです。サイクルの曲線の一部分しか見なければ、全体を正確に測り知るのは難しいでしょう。短期間で起きた進歩を見過ごしてしまうか、長期間で起こる進歩を見届けられないかのどちらかです。驚くべきことは世の中の事象がいかに速く変化するかではなく、その変化に呼応するエンジニアリングの変革がいかに遅いかということです。画像は、1891年に発明された、電話回線を自動で接続するストロージャー式自動交換機です。 1951年、デジタル交換機の最先端において、典型的な中央電話交換局はビクトリア期の特大サイズでした。ストロージャー式自動交換機は、通信中の全ての電話の信号を扱っていました。
raimon49 2015/01/16
データとアクセスの増大をさばいて来た歩みとこれから。めっちゃ面白かった。

DB

Hadoop

MapReduce

NoSQL

SQL

cache

memcached

memory

performance

歴史
リンク
MapReduceは「ゆっくり死んでいく」、Hadoop開発者のカッティング氏
オープンソースソフトウエア（OSS）の分散データ処理ソフト「Hadoop」が、大きな変貌を遂げ始めている。バッチ処理だけでなく、SQLクエリーを使ったインタラクティブ分析やインメモリー処理、機械学習処理などへと適用領域を広げているからだ。Hadoopのオリジナル開発者であるダグ・カッティング氏は、「新しい時代が始まった」と語る。現在のHadoopの状況をどのように見ているか？同じような機能を備えたコンポーネントが複数提案されるなど重複はあるが、技術開発は非常に高速に進んでいる。（米Apacheソフトウエア財団が2013年10月に正式版をリリースした）スケジューラーの「YARN」によって、（Hadoopのストレージシステムである）「HDFS」の上に、様々なテクノロジーを共存できるようになったことが大きい。私が特に驚いているのは、（DAG：Directed Acyclic Graph＝有向
raimon49 2014/08/04
Hadoop

MapReduce

OSS

インタビュー
リンク
Hadoop初のメージャーバージョンアップ「Hadoop 2」正式版が公開。MapReduce以外の分散処理フレームワークも実行可能に
The Apache Software Foundationは、Hadoopの初めてのメジャーバージョンアップとなる「Apache Hadoop 2」の正式版公開を発表しました。 Hadoopは2004年にGoogleが公開したMapReduceに関する論文を元にオープンソースとして開発されたものでした。Hadoopの開発者であるダグ・カッティング氏は、Hadoop 2のプレスリリースで次のように発言しています。 "What started out a few years ago as a scala ble batch processing system for Java programmers has now emerged as the kernel of the operating system for big data," said original Hadoop creator
raimon49 2013/10/20
Apache

Hadoop

MapReduce
リンク
TechCrunch | Startup and Technology News
Byju’s is cutting 500 to 1,000 more jobs at the firm, this time eliminating several non-sales roles as well, as the Indian edtech giant pushes to improve its finances, according to a person fami While platforms like Reddit and Twitter are changing rules and making life difficult for developers of third-party clients, the ecosystem of Mastodon apps is still growing. Today, indie developer Jake
raimon49 2013/04/02
Hadoop

MapReduce

OSS

Google

license
リンク
世界初！ Hadoopとの連携を実現したCOBOL「NetCOBOL V10.5」を販売開始 : 富士通
PRESS RELEASE 2012年12月5日富士通株式会社世界初！ Hadoopとの連携を実現したCOBOL「Net COBOL V10.5」を販売開始並列分散処理により、バッチ処理時間を従来の約18分の1に短縮当社は、COBOLバッチアプリケーションをApache Hadoop（注1）で並列分散処理し、バッチ処理時間を大幅に短縮する機能を追加したCOBOL開発・運用ソフトウェア「Net COBOL V10.5」を、本日より販売します。本製品は、Hadoopとの連携を実現した世界初（注2）のCOBOL開発・運用ソフトウェアです。「Net COBOL」で開発したバッチアプリケーションや他社のCOBOLで開発されたバッチアプリケーションを、再コンパイルによりHadoopで並列分散処理できるため、お客様は既存のCOBOLデータやアプリケーションに手を加えることなく、バッチ処理時間を大幅に
raimon49 2012/12/06
AWS

COBOL

Hadoop

MapReduce
リンク
今時のWebエンジニアの入り口としてのGAE - ku-sukeのブログ
本日、GoogleがCloud SQL（MySQLのレンタルみたいなの）の無料版を発表しました。500MB/6ヶ月でGoogle App Engineなどから無料で使えるようです。さて、それはいいとして最近弊社なども含め、今時の環境って本気だすと複雑化してますよね。OSCで発表された前佛さんのMunin資料を31pと２つ戻って29pを見比べてみてくださいｗ Muninではじめる実践★リソース監視　-俺のサーバがこんなに重いはずがない、を乗り切るために- from Masahito Zembutsu こんなの絶対おかしいよ！！ NoSQLや非同期処理など、様々な新しい技術にチャレンジしたいと思っていても、どこから手を付けよう、、みたいなことってありますよね。Cassandraがいいのかな、Redisがいいのかな？みたいにはてブの着いた記事があれば読んでみるんだけど、インストールとか面倒そう
raimon49 2012/11/13
再入門したいのでタグ整理。

GAE

MapReduce

NoSQL

Python

deployment

memcached

pattern

performance

study

あとで読む
リンク
分散と集中の繰り返し: ある nakagami の日記
僕が最初にプログラミングした頃、たまたま Unix のワークステーション上で仕事させてもらえて、TCP/IP について学ばせてもらった。ちょうど、その頃に TCP/IP が一般的なものになってきてて「これからは、クライアントサーバーだ」ということになった。一極集中のシステムに比べて、小さいコンピュータで分散して処理できたので、（特にハードウェアの面で）コストダウンすげー、ということになった。世の中には VB6 + Oracle という構成があふれた。ところが、クライアントプログラムに更新が入ると配布が大変で、95年頃になるとインターネットブームだったり、Windows にブラウザが標準搭載されたことがあって、「これからは、Web+DB だ」ってなった。プログラムをサーバーにおいているのでそこを修正したら、みんなのパソコンにプログラムを再インストールしなくて済んだ。なんとなく
raimon49 2012/06/03
IT業界

VB

Oracle

Windows

MySQL

PostgreSQL

Hadoop

MapReduce

Fusion-io

歴史
リンク
“統計の基礎を無視している”Hadoop使いが考えるビッグデータ
Hadoopをバッチ処理の高速化に活用しているノーチラス・テクノロジーズは、ビッグデータのブームに真っ向から異論を唱える。「ビッグデータは中身のないバズワード」と断言する代表取締役社長神林飛志氏に、その真意を聞いた。 Hadoop＝ビッグデータは大きな誤解ノーチラス・テクノロジーズは、基幹系システム向けのミドルウェアを手がける国産ベンチャー。Webサービスのように決して派手ではないが、「そもそもダウンすると、飛行機が飛ばないとか、病院で人が死んでしまうとか、電車が動かないとか、生活に影響が出る分野」（神林氏）という、まさにミッションクリティカルな領域のITで、同社の製品は活用されている。同社の「Asakusa Framework」は、Hadoopを活用した分散処理により、基幹系バッチの高速化を実現する。神林氏は、「Hadoopというと、WebやSNS系、BIやデータ解析での使い方がメ
raimon49 2012/05/10
言ってることは頷けるけど、ギガバイトクラスのデータまでビッグデータって呼んでるのは、どこ界隈の話なんだ？　SIerでそうやって売り込んでるのかな。

BigData

Hadoop

MapReduce

analysis
リンク
掲載終了のお知らせ : 富士通
ご利用いただきありがとうございます。本ページは掲載を終了いたしました。 PCクラスタソリューション Excel高速化ソリューション関連情報については、以下のページをご参照ください。 FUJITSU Server PRIMERGY PCクラスタ
raimon49 2012/03/16
専用PCクラスタを組んでスケールアウト。これは本当のソリューションと言って良い代物。見積もりで幾ら出されるのか怖いけど。

Excel

MapReduce

macro

performance

並列

富士通
リンク
MapReduce Patterns, Algorithms, and Use Cases
In this article I digested a number of MapReduce patterns and algorithms to give a systematic view of the different techniques that can be found on the web or scientific articles. Several practical case studies are also provided. All descriptions and code snippets use the standard Hadoop’s MapReduce model with Mappers, Reduces, Combiners, Partitioners, and sorting. This framework is depicted in th
raimon49 2012/03/04
MapReduce

algorithm

pattern
リンク
AKB48 の Google+ アクティビティデータを MongoDB で MapReduce してみた - tilfin's note 跡地
MapReduce について実際やってみたことがなかったので、Mongo DB で試しそうと思っていました。そんななか、AKB48 の（18歳以上？の）メンバーが Google+ を開始しました。これで「バルス」以上に定時でかつてない負荷が Google+ にかかり始めたと思われます。ということで、扱うにはもってこいなデータなのでこれを使うことにしました。 Google+ API は今のところデータのGETしかできないようですが、それで充分です。とりあえずメンバーの Googel+ のID（？）と名前をMongo DB のコレクションに突っ込みます。それを元に定期的に各メンバーのアクティビティ（活動のエントリ）を取得しては、 JSON をそのままほぼそのまま別のコレクションに突っ込みました。メンバーの取得とセット AKB48 Now on Google+ のHTMLを適当にパースして突
raimon49 2012/01/01
MongoDBシェルでmapReduce

MapReduce

MongoDB

Google+
リンク
アップグレードと異なるプログラミングパラダイムのためのHadoop再設計
Rustが再評価される：エコシステムの現状と落とし穴 In this article, we share findings and insights about the Rust community and ecosystem and elaborate on the peculiarities and pitfalls of starting new projects with Rust or migrating to Rust from othe...
raimon49 2011/09/06
Hadoop

MapReduce

Yahoo

performance

refactoring

あとで読んだ
リンク
1 2 3 次のページ