[B! analytics][data] Makotsのブックマーク

Makots id:Makots

analyticsとdataに関するMakotsのブックマーク (46)

俺のDXを実現するためのサーバレスなデータ基盤開発と運用 / Serverless Data Platform and Baseball
Developers Summit 2023登壇資料 https://event.shoeisha.jp/devsumi/20230209/session/4196/
Makots 2023/02/20
serverless

data

analytics

infrastructure

gcp

python

go

dashboard

slides
リンク
AI Jupyter Notebook for Data and Excel Automations | Mito
Analysts automate Excel reports without writing code from scratchData scientists accelerate EDA, visualization, and feature engineeringML engineers build and iterate on models faster with AI assistance %%%%%####%# %%%%%%%#####*****###%%## ####*#****++****+++++=:....:-== %*++=+++****+=-=#+----:-==---:.. .:== =+*-==++***=+=--+--*=--=-==-------=-....-= --.=-=+*****:-+=#=+=+==++++++++==*==-:---...-= -
Makots 2023/01/20
analytics

tools

python

data
リンク
新しいデータ基盤アーキテクチャである「データレイクハウス」について調べてみた - Taste of Tech Topics
最近ソーダストリームを買い、炭酸水を飲むのにはまってます。機械学習エンジニアの@yktm31です。以前に「AWS Lake Formationでデータレイク体験！」という記事を書いてみて、データ基盤アーキテクチャに興味が湧いてきました。データレイクハウスは、「データウェアハウス」と「データレイク」を統合したようなアーキテクチャで、 2020年にDatabricks社により提唱され、新しいデータ基盤アーキテクチャとして注目されているようです。 www.databricks.com そこで今回、「データレイクハウス」について調べてみたことをまとめてみたいと思います。なぜデータレイクハウスが注目されているのか？データウェアハウスの特徴・課題データレイクの特徴・課題データレイクハウスの特徴データレイクハウスのアーキテクチャ Azure Azure Synapse Analyticsを
Makots 2022/11/25
data

analytics

infrastructure

architecture

aws
リンク
[レポート]みんなの考えた最強のデータアーキテクチャ #datatechjp | DevelopersIO
さがらです。 11月8日20時～22時に、datatech-jp(データエンジニアリング関係のコミュニティ)主催でみんなの考えた最強のデータアーキテクチャというイベントが開催されました。本記事はこのイベントのレポートブログとなります。イベント概要 ※connpassより引用 datatech-jpで集ったデータエンジニアが、それぞれみんなの考えた最強のデータアーキテクチャを紹介し合うという夢のような企画が実現しました！たくさんの新しいプロダクトが群雄割拠する現在、モダンデータスタックなどという言葉も登場しています。今こそ、どんなプロダクトを選び、どのようなデータ基盤を作れば、効率的にやりたいことが実現できるのか。 5人の猛者からおすすめの構成をご紹介いただきながら、参加者のみなさんとも一緒に考えていく時間としたいと思います。おまけ：当イベントの応募者数このイベントですが、なんと
Makots 2022/11/09
architecture

data

analytics

infrastructure

design
リンク
サブスクリプション型のビジネスなら見ておくべき5つの超重要チャート - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? サブスクリプション型のビジネス、またはソフトウェアの世界ではSaaSと言われたりする、顧客が製品やサービスを継続的に利用するために購読するタイプのビジネスは一般的な売り切り型のビジネスとは収益構造が異なるため、ビジネスを成長させるために見るべき指標やチャートも違ってきます。よくあるのは、この違いを意識せずに「売り切り型」のビジネスでよく使われる指標やチャートをモニターしていたがために、ビジネスの成長のきっかけをつかめなかったり、成長していると思っていたビジネスが急に傾き始めたり、成長の見通しを社内で共有、または外部の投資家にうまく説明
Makots 2022/07/20
statistics

visualization

data

analysis

analytics
リンク
AWS データレイク事例祭り登壇資料
AWS データレイク事例祭り登壇資料です。
Makots 2022/06/27
aws

data

analytics

slides

datalake
リンク
GitHub - Azure/jp-sqlsecurity: データ基盤で求められるセキュリティと、Microsoft Defender for SQL を使った効果的なセキュリティ対策について紹介
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Makots 2022/06/01
ms

azure

data

analytics

security
リンク
ステージング環境における検証用データベースの立ち上げを自動化する取り組み - KAYAC Engineers' Blog
SREチーム(新卒)の市川恭佑です。カヤックのサービスでは、信頼性の担保を目的として、ステージング環境を作成する方針を取っています。ステージング環境では、検証の精度を高めるために、量・質ともに本番環境に類似したデータベースが求められる局面が頻出します。そこで今回は、Tonamel という自社サービスにおける、検証用データベースの立ち上げを自動化する取り組みについて紹介します。サービスの置かれていた状況と解決方針 Tonamel の実行基盤は Amazon Web Services (AWS) 上にあり、本番環境とステージング環境は別のアカウントとして、同一の AWS Organizations 組織内に構築されています。もともと、ステージング環境では、本番環境のデータは利用せず、手作業でダミーデータを作成していました。それゆえに、データベースに格納されているデータ量は本番環境と
Makots 2022/06/01
backup

db

data

analytics

architecture
リンク
データ整備の基礎
2022/04/07 初版公開お問い合わせ先 Twitter：@data_analyst_ メールフォーム：https://bit.ly/37orRqa 執筆者：しんゆうブログ：データ分…
Makots 2022/04/08
data

analytics

analysis

slides
リンク
民間企業におけるデータ整備の課題と工夫 / 20220305
第16回日本統計学会春季集会での発表資料です。 https://confit.atlas.jp/guide/event/tjss2022spring/top https://ies.keio.ac.jp/events/17173/ 講義や共同研究のご相談はブログのお問い合わせ欄にご連絡ください…
Makots 2022/03/07
data

management

analytics

analysis

slides
リンク
データ基盤による利益最大化と初期構築プロセス / 20220209
「Data Cross Conference」の登壇資料です。 https://dcc2022.datafluct.com/ データ活用によって億単位の利益を創出してきた登壇者が、データ基盤をこれから構築する方に向けて、費用対効果を最大化するための初期構築プロセスを紹介します。 -----…
Makots 2022/02/08
machinelearning

infrastructure

architecture

data

analytics
リンク
dbt (data build tool) を使ってデータをテストする - CUBE SUGAR CONTAINER
ソフトウェアエンジニアリングの世界では、自動化されたテストを使ってコードの振る舞いを検証するのが当たり前になっている。同じように、データエンジニアリングの世界でも、自動化されたテストを使ってデータの振る舞いを検証するのが望ましい。データをテストするのに使える OSS のフレームワークも、いくつか存在する。今回は、その中でも dbt (data build tool) を使ってデータをテストする方法について見ていく。 dbt 自体はデータのテストを主目的としたツールではないものの、テストに関する機能も備えている。また、dbt には WebUI を備えたマネージドサービスとしての dbt Cloud と、CLI で操作するスタンドアロン版の dbt Core がある。今回扱うのは後者の dbt Core になる。使った環境は次のとおり。 $ sw_vers ProductName:
Makots 2022/02/07
data

dbt

test

analytics
リンク
オープンソースのデータ管理システム「CKAN」を試してみた | DevelopersIO
こんにちは！DA(データアナリティクス)事業本部サービスソリューション部の大高です。最近「データカタログ」について調べていたのですが、自治体のオープンデータサイト「自治体オープンデータ」でも「データカタログ」を利用していることを知りました。「自治体オープンデータ」は，オープンソースソフトウェアのCKANを利用して，データカタログの機能を提供しております。この「CKAN」というシステムが、どのようなものか興味を持ったので、調査して実際に少し触ってみたいと思います。 CKANとは？ CKAN(Comprehensive Knowledge Archive Network)はオープンソースのデータ管理システムです。Open Knowledge Foundationによって開発され、様々な国や自治体におけるオープンデータ公開サイトで利用されています。利用例 CKANはカナダ、アメリカ、オ
Makots 2022/01/17
ckan

data

analytics

management

oss

tools
リンク
Data Management Guide - 事業成長を支えるデータ基盤のDev&Ops #TechMar / 20211210
---------------------------------------------------------------------------------------- 【PR】一緒に働きましょう！ https://kazaneya.com/kdec -------------------…
Makots 2021/12/10
data

management

analytics

dx

architecture

slides
リンク
Modern Data Stack / モダンデータスタックというトレンドについて - satoshihirose.log
はじめに Modern Data Stack ? Modern Data Stack の特徴やメリット、関連するトレンドデータインフラのクラウドサービス化 / Data infrastructure as a service データ連携サービスの発展 ELT! ELT! ELT! Reverse ETL テンプレート化された SQL and YAML などによるデータの管理セマンティックレイヤーの凋落と Headless BI 計算フレームワーク (Computation Frameworks) 分析プロセスの民主化、データガバナンスとデータメッシュの試みプロダクト組み込み用データサービスリアルタイム Analytics Engineer の登場各社ファウンダーが考える Modern Data Stack さいごに Further Readings はじめに Modern Dat
Makots 2021/11/21
data

analysis

management

architecture

analytics
リンク
図書館オープンデータを使って図書館データポータルサイトを作りました - Qiita
国立国会図書館では、さまざまなオープンデータが公開されています。その中に「図書館及び関連組織のための国際標準識別子（ISIL）」試行版LODがあります。これは、日本全国の図書館に関する情報が網羅的にまとめられているRDFデータとなります。提供されているデータはXMLファイルなので個別にデータを取得するためにはプログラムなどで処理する必要があるので、Webブラウザで各データを見やすく提供するWebサイト「図書館施設データポータル」を作成しました。ここでは、図書館施設データポータルを紹介します。図書館及び関連組織のための国際標準識別子（ISIL）」試行版LOD とは元データは、「図書館及び関連組織のための国際標準識別子（ISIL）」という図書館等につけられる国際的な識別子で、国立国会図書館では、このISILが付与される図書館の情報をオープンデータ(XMLファイルのRDFデータ)
Makots 2021/09/13
library

data

analytics
リンク
Resilience and Vibrancy: The 2020 Data & AI Landscape
In a year like no other in recent memory, the data ecosystem is showing not just remarkable resilience but exciting vibrancy. When COVID hit the world a few months ago, an extended period of gloom seemed all but inevitable. Yet, as per Satya Nadella, “two years of digital transf ormation [occurred] in two months”. Cloud and data techno logies (data infrastructure, machine learning / artificial in
Makots 2021/09/02
data

analytics

management

ai

architecture
リンク
データ分析基盤における個人情報の扱いについて - NRIネットコムBlog
こんにちは佐々木です。誰に望まれた訳でもないですが、データ分析基盤の設計シリーズの第三弾です。今回のテーマは、データ分析基盤における個人情報＆パーソナルデータの扱いについてです。ここを最初に考えておかないと、データ分析基盤は毒入りとなって、扱いづらいものになります。データ分析基盤構築の肝は、データレイクとDWHの分離 - NRIネットコムBlog データレイクはRAWデータレイク・中間データレイク・構造化データレイクの３層構造にすると良い - NRIネットコムBlog 個人情報＆パーソナルデータと匿名加工についてまず最初に個人情報＆パーソナルデータの定義と匿名加工について、サラッと確認しておきましょう。個人情報＆パーソナルデータ個人情報とは、任意の一個人に関する情報であり、かつその情報をもとに個人を特定できるものを指します。代表的な個人情報としては、名前・住所・電話番号・E-ma
Makots 2021/06/02
design

security

architecture

data

analytics

infrastructure
リンク
Matomo - The Google Analytics alternative that protects your data
Other web & app analytics give you estimates, Matomo gives you answers. Track 100% of available traffic with confidence.
Makots 2021/03/11
analytics

tools

data

web

marketing

oss

log
リンク
LINEの新しいセルフサービス型バッチデータ収集システム「Frey」の導入
こんにちは、Data Platform室Data Engineering 1チームの徐です。 Data Platform室では、大規模なHadoopクラスタを運用し、データ収集、分析、活用するためのプラットフォームを提供しています。Data Engineering 1チームのミッションの一つは、様々なストレージからのdata ingestionシステムを構築、運用することです。本記事では、バッチ処理でデータ収集を行うシステムの概要を説明した後に、LINEのセルフサービスツールであるFreyをご紹介します。課題：このシステムでもデータ収集のバッチ処理を実行・管理するという目的は果たせましたし、ユーザーとタスクの規模が小〜中程度であれば問題はありませんでした。しかし、LINEの全てのプロダクトまでスコープを広げるにつれ、次のような問題に躓くことが増えていきました。コード記述（ステップ1
Makots 2021/03/08
data

batch

analytics

line

architecture
リンク
1 2 3 次のページ