[B! concurrent-computing][analytics] nabinnoのブックマーク

nabinno id:nabinno

concurrent-computingとanalyticsに関するnabinnoのブックマーク (7)

Azure HDInsight - Hadoop、Spark、Kafka | Microsoft Azure
nabinno 2019/09/20
azure-hdinsight

apache-hadoop

apache-spark

apache-kafka

concurrent-computing

extract-transform-load

analytics
リンク
[レポート]ANT398 – Amazon Managed Streaming for Kafka (Amazon MSK)入門 #reinvent | DevelopersIO
本記事はAWS re:Invent 2018のSession「ANT398 - [NEW LAUNCH!] Introducing Amazon Managed Streaming for Kafka (Amazon MSK)」のレポートです。 re:Invent 中に発表された Apache Kafka のフルマネージドサービス「Amazon Managed Streaming for Kafka (Amazon MSK)」の入門セッションです。セッションについてスピーカー Damian Wylie - Principal Product Manager 概要 Discover the power of running Apache Kafka on a fully managed AWS service. In this session, we describe how Amazo
nabinno 2019/09/08
classmethod

amazon-msk

amazon-kinesis-data-streams

publish-subscribe-pattern

concurrent-computing

analytics
リンク
Apache Spark を実行しているAmazon Kinesis Data Firehose と Amazon EMR によるダウンストリームデータ処理の最適化 | Amazon Web Services
Amazon Web Services ブログ Apache Spark を実行しているAmazon Kinesis Data Firehose と Amazon EMR によるダウンストリームデータ処理の最適化増え続けるデータを処理し、新しいデータソースを取り込むことは、多くの組織にとって大きな課題となっています。多くの場合、AWS のお客様は接続中のさまざまなデバイスやセンサーからメッセージを受け取っていますが、それらを詳しく分析する前に、効率的に取り込み、処理する必要があります。結果として、あらゆる種類のデータが行き着くソリューションが Amazon S3 となるのは当然と言えるでしょう。ただし、データが Amazon S3 に格納される方法によって、ダウンストリームデータ処理の効率とコストに大きな違いが生じる可能性があります。具体的に言うと、Apache Spar
nabinno 2019/09/08
srikanth-kodai

amazon-kinesis

amazon-kinesis-data-firehose

amazon-emr

apache-spark

publish-subscribe-pattern

concurrent-computing

analytics
リンク
AWS Kinesis Streams + Spark Streamingでストリーム処理を試してみた - Qiita
はじめに今後はストリーム処理の時代がくるはずです。たぶん。そんな気がします。というわけで、適当なデータ発生を発生させて、Kinesis Streams＋Spark streamingでストリーム処理を体験してみました。 Spark 2.0.0 (EMRを利用） Kinesis Streamsとは昔は単にKinesisと呼ばれていましたが、後からKinesis FirehoseとKinesis Analyticsが追加されたため、Kinesis３兄弟のうちの１人と呼ばれています。大規模でスケール可能で、メッセージが一定時間保存されるPubSub型キューのことを指します。つまり、データを発生させるProducer相当と、後段の処理であるConsumer相当を作成する必要があります。 Spark Streamingとは大規模データ分散処理フレームワークのApache sparkのライ
nabinno 2019/09/08
qiita

amazon-kinesis

amazon-kinesis-streams

amazon-emr

apache-spark

publish-subscribe-pattern

concurrent-computing

analytics
リンク
Azure Stream Analytics | Microsoft Azure
ミッションクリティカルなワークロード用に設計された、使いやすいリアルタイム分析サービスである Azure Stream Analytics をご紹介します。ほんの数クリックでエンドツーエンドのサーバーレスストリーミングパイプラインを構築できます。SQL を使用して数分以内にゼロから実稼働に移行 — カスタムコードと組み込みの機械学習機能を使用して簡単により高度なシナリオ向けに拡張することができます。財務的に保証された SLA の信頼度で、最も要求の厳しいワークロードを実行できます。
nabinno 2019/09/08
azure-stream-analytics

apache-kafka

apache-kafka-stream

publish-subscribe-pattern

analytics

concurrent-computing
リンク
Digdag - Open Source Workflow Engine for the Multi-Cloud Era
Digdag is a simple tool that helps you to build, run, schedule, and monitor complex pipelines of tasks. It handles dependency resolution so that tasks run in series or in parallel. Digdag replaces cron, facilitates IT operations automation, orchestrates data engineering tasks, coordinates machine learning pipelines, and more.
nabinno 2016/06/16
digdag

machine-learning

analytics

directed-acyclic-graph

graph-theory

data-structure
リンク
Apache Spark™ - Unified Engine for large-scale data analytics
Apache Spark™ is a multi-language engine for executing data engineering, data science, and machine learning on single-node machines or clusters.
nabinno 2014/12/07
apache-spark

data-mining

python

graphx

scala

apache-software-foundation

machine-learning

mapreduce

database
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx