[B! scala][技術] letitrideのブックマーク

letitride id:letitride

scalaと技術に関するletitrideのブックマーク (2)

分散処理に入門してみた（Hadoop + Spark） | Casley Deep Innovations株式会社技術ブログ
こんにちは。SI部の腰塚です。 RDBやデータウェアハウスの仕事に携わることが多かった筆者は、数年前からたびたび聞こえたビッグデータ分析や機械学習のための分散処理フレームワークに興味を覚えたものの、ついぞアクセスしないままここまで来てしまいました。今回ブログを書くにあたって、せっかくなのでイチから手さぐり入門し、いまさら他人に聞けない分散処理の初歩からhadoop・sparkを触ってみるまでをまとめたいと思います。 1.分散処理の基礎知識 1-1.分散処理の処理方式：MapReduce まず分散処理とは、ひとつの計算処理をネットワークで接続した複数のコンピュータで同時並列で処理することです。ビッグデータ活用の市場が日々大きくなるに従って、数百テラ～ペタのデータ処理も珍しいものではなくなっており、日常的にこの規模のデータを扱うシステムでは、現実的な時間的・費用的コストで処理する工夫が必要
letitride 2020/08/12
hadoop + hive + sparkの導入サンプル記事

技術

scala
リンク
Future内でThread.sleepはするな - ましめも
前回の記事(Scala ExecutionContextって何 / Futureはスレッド立ち上げじゃないよ - ましめも) で import scala.concurrent.ExecutionContext.Implicits.global とは何なのか、そもそも ExecutionContext とはということについて解説した。おさらい ExecutionContext はスレッドプールを持っていて、そこにタスクを割り当てる機構 ExecutionContext.Implicits.global はデフォルトではCPUコア数分のスレッドを持っている Future内でThread.sleepはご法度 ExecutionContext.Implicits.global を使っている状態でThread.sleepをすると非常に迷惑になることがある。例えば次のようなコードがあったとし
letitride 2020/05/27
Futureをスレッドプールを指定して起動する

技術

scala
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx