shiumachiのブックマーク / 2015年8月10日

第8回　データ処理における並列アルゴリズム［3］ | gihyo.jp

はじめに前回は、結合処理の並列化における基本戦略について説明し、ソートマージ結合における具体的な並列アルゴリズムを説明しました。今回は、ImpalaやPrestoに加えて、Apache SparkやHadoop MapReduceのMap Joinにおいても用いられているハッシュ結合における具体的な並列アルゴリズムを説明します。ハッシュ結合における並列アルゴリズムハッシュ結合は、2つのデータにおいて同一の属性値をもつレコードを見つける方法として、レコードのハッシュ値を用いるものです[1]⁠。すなわち、当該方法においては、一方のデータのすべてのレコードの結合キーに対してハッシュ関数を用いてハッシュ値を計算し、当該ハッシュ値からなるハッシュ表を事前に構築しておき、他方のデータのレコードの結合キーに対して同一のハッシュ関数から得られたハッシュ値を用いてハッシュ表を参照することにより、同一の

はてなブックマーク

タグ

2015年8月10日のブックマーク (3件)

http://blog.yoslab.com/entry/2014/12/15/234342

第8回　データ処理における並列アルゴリズム［3］ | gihyo.jp

Adobeeが語る、Tier7を超える方法 | GAMERS LEAGUE

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

2015年8月10日のブックマーク (3件)

http://blog.yoslab.com/entry/2014/12/15/234342

第8回 データ処理における並列アルゴリズム［3］ | gihyo.jp

Adobeeが語る、Tier7を超える方法 | GAMERS LEAGUE

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

第8回　データ処理における並列アルゴリズム［3］ | gihyo.jp