[B! analytics][analysis] Makotsのブックマーク

Makots id:Makots

analyticsとanalysisに関するMakotsのブックマーク (37)

戦略と実行をつなぐデータ
The Director’s Chair: Orchestrating AI for Truly Effective Learning
Makots 2023/03/16
analysis

analytics

strategy

business

planning

slides
リンク
Delta Lake とは何か - connecting the dots
はじめに環境情報 Delta Lake (デルタレイク) とは Delta Lake の実体 Delta Lake の構造 Parquet と Delta の相違点 Parquetとは何か Parquetの構造 Parquet と Delta の違い Delta Lake が生まれた経緯: データレイクと Delta Lake の違いデータレイクのメリットデータレイクの課題 *Parquetで構築した場合 Delta Lake の特徴 ACIDトランザクションの担保スケーラブルなメタデータ管理バッチとストリーミングワークロードの統合タイムトラベル (バージョン管理) CONSTRAINT句のサポート DML (データ操作言語) のフルサポート UPDATE DELETE MERGE 柔軟なスキーマ管理 1. スキーマエンフォースメント 2. スキーマエボリューションストレ
Makots 2022/09/17
hadoop

analytics

analysis

oss

deltalake
リンク
モデリングはキラキラ技術より地味だが役に立つ / modeling-over-shiny-tech
# Event データモデリングとデータ基盤の構築・運用（第14回ちゅらコラボ）CARTA HOLDINGS x ちゅらデータ合同イベント https://churadata.connpass.com/event/254417/ ぼくのかんがえる最高のレポーティング基盤 …
Makots 2022/08/20
modeling

db

log

slides

analytics

analysis
リンク
サブスクリプション型のビジネスなら見ておくべき5つの超重要チャート - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? サブスクリプション型のビジネス、またはソフトウェアの世界ではSaaSと言われたりする、顧客が製品やサービスを継続的に利用するために購読するタイプのビジネスは一般的な売り切り型のビジネスとは収益構造が異なるため、ビジネスを成長させるために見るべき指標やチャートも違ってきます。よくあるのは、この違いを意識せずに「売り切り型」のビジネスでよく使われる指標やチャートをモニターしていたがために、ビジネスの成長のきっかけをつかめなかったり、成長していると思っていたビジネスが急に傾き始めたり、成長の見通しを社内で共有、または外部の投資家にうまく説明
Makots 2022/07/20
statistics

visualization

data

analysis

analytics
リンク
データ整備の基礎
2022/04/07 初版公開お問い合わせ先 Twitter：@data_analyst_ メールフォーム：https://bit.ly/37orRqa 執筆者：しんゆうブログ：データ分…
Makots 2022/04/08
data

analytics

analysis

slides
リンク
文春オンラインの記事分析を支える爆速ダッシュボードを作るまで｜田島将太 | TAJIMA Shota
従来のGoogleアナリティクスである、ユニバーサルアナリティクス（以下UA）のサポートがいよいよ2023年7月に終了することが、先日アナウンスされました（※）。昨年対比やトレンドをチェックすることを考えると、2022年内できるだけ早めに次世代のGoogleアナリティクス（以下GA4）へ移行したいWebメディア運営者も多いかと思います。新しいツールの勉強や、既存システムの改修が必要な問題ではありますが、この機会を、データ収集・可視化の設計を見直し、日々の意思決定の共通言語としてデータを使いやすくするチャンスと捉えてみてはいかがでしょうか。 ※ Google、ユニバーサルアナリティクスのサポートを2023年7月1日に終了。早めのGA4移行を推奨このnoteでは、前半でダッシュボードによるデータの可視化にコストをかけるべき理由を整理します。後半では、2021年秋に文春オンラインのダッシュ
Makots 2022/04/05
google

analytics

marketing

analysis

dashboard
リンク
民間企業におけるデータ整備の課題と工夫 / 20220305
第16回日本統計学会春季集会での発表資料です。 https://confit.atlas.jp/guide/event/tjss2022spring/top https://ies.keio.ac.jp/events/17173/ 講義や共同研究のご相談はブログのお問い合わせ欄にご連絡ください…
Makots 2022/03/07
data

management

analytics

analysis

slides
リンク
生活者ターゲティングの時代は終わり、エコノメトリクスによるマーケティングが台頭する - 渋谷駅前で働くデータサイエンティストのブログ
(Image by Mediamodifier from Pixabay) 実はもう1年以上前のことなのですが、LinkedInで以下の記事を見かけて「おー、ようやくこういう意見が公の場に出てくるようになったんだな」と思ったのでした。原文は英語ですが、短い文章なので英語が不得手な方でも各種翻訳サービスなどを使えばサクッと読めるのではないかと思います。で、何故そういう感想を抱いたのかというと「個人的にはもう2017年ぐらいからほぼ同じことを考えていたから」です。しかし、広告マーケティング業界（特にオンライン広告）では長年に渡り「個々の顧客にone-to-oneで訴求できることこそが最重要」という考え方が主流となってきていて、近年のパーソナライズド広告や見ようによってはレコメンデーションもその流れに沿って隆盛を誇ってきたアプローチとも言えます。そこに満を持して一石を投じる形になったのが、上記
Makots 2022/01/16
marketing

analysis

analytics

machinelearning
リンク
新型コロナ重症化リスクファクター分析　XGBoost+SHAPによるEDA - JMDC TECH BLOG
JMDC データサイエンティストの齋藤です。データ分析の第一歩、EDA（探索的データ分析）にどう取り組んでいますか？予測のための機械学習の話はよく聞きますが、EDAのための機械学習はあまり目にしないと感じるので、今回は実務における「XGBoost+SHAPによるEDA」の実践例を取り上げてみたいと思います。題材は２０２１年７月にリリースした「新型コロナウイルス感染時の重症化リスクファクターに関する分析結果」です。 https://www.jmdc.co.jp/wp-content/uploads/2021/07/news20210709_2.pdf このブログの内容はテクニカル中心ですが、分析結果自体も面白いのでレポートもご覧いただけると嬉しいです。 XGBoost+SHAPでEDAする理由分析デザインの概要 Feature Importance SHAP XGBoost+SHA
Makots 2022/01/11
analysis

analytics

deeplearning

shap
リンク
Modern Data Stack / モダンデータスタックというトレンドについて - satoshihirose.log
はじめに Modern Data Stack ? Modern Data Stack の特徴やメリット、関連するトレンドデータインフラのクラウドサービス化 / Data infrastructure as a service データ連携サービスの発展 ELT! ELT! ELT! Reverse ETL テンプレート化された SQL and YAML などによるデータの管理セマンティックレイヤーの凋落と Headless BI 計算フレームワーク (Computation Frameworks) 分析プロセスの民主化、データガバナンスとデータメッシュの試みプロダクト組み込み用データサービスリアルタイム Analytics Engineer の登場各社ファウンダーが考える Modern Data Stack さいごに Further Readings はじめに Modern Dat
Makots 2021/11/21
data

analysis

management

architecture

analytics
リンク
Pythonによるアクセスログ解析入門 / Tutorial on Access Log Analysis by Python
PyConJP 2021での発表(https://2021.pycon.jp/time-table?id=269506) で利用した資料です。サンプルコード (https://colab.research.google.com/drive/1r4GcXWvM-j-dlfT0XF-O-Y5DiyAM-gG…
Makots 2021/10/17
analysis

python

analytics

slides

log
リンク
「施策デザインのための機械学習入門」を完全に理解したサトシくんがポケモン捕獲アルゴリズムを実装する話 - kanayamaのブログ
プロローグストーリー編第1章感銘 step1. KPIの設定 step2. データの観測構造をモデル化する step3. 解くべき問題を特定する step4. 観測データのみを用いて問題を解く方法を考える step5. 機械学習モデルを学習する step6. 施策を導入する第2章絶望第3章反省第4章再起 step1（再） KPIの設定 step2（再）データの観測構造をモデル化する step3（再）解くべき問題を特定する step4（再）観測データのみを用いて問題を解く方法を考える step5（再）機械学習モデルを学習する step6（再）施策を導入する第5章俺たちの戦いはこれからだ！実装編準備擬似データの生成意思決定モデルの学習モデルのオフ方策評価モデルの真の性能の評価まとめこの記事を読んだ方はこんな記事も読んでいます（多分） @tkana
Makots 2021/10/06
machinelearning

analysis

analytics
リンク
可視化や統計でデータに『恣意的なストーリーを語らせる』16の闇の魔術【bad charts】 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 闇の魔術に対する防衛術 Advent Calendar 2020の三日目はじめにデータの可視化は非常に難しい。まずデータの抽出が難しい・データソースごとの整合性が取れているか・取得したデータとソースデータに欠損が生じていないか・SQL文を実行したサマリの結果が部分的に抜け落ちていないか。その確認は時間的にも精神的にも苦痛。しかし、苦労して抽出したデータも使い方で全くの無駄になるその例として「可視化や統計」部分に着目してお話をしようと考えた。データの背景を知らない人には、データ可視化が歩み寄る手段になるし、伝えたい事を
Makots 2021/05/08
visualization

仕事

marketing

graph

analytics

analysis

anti-pattern
リンク
分析基盤と組織のあり方 - DeNAの事例
今回のテーマは「分析基盤をうまく組織に浸透させる方法」です。「分析基盤を浸透させていく上で、分析基盤を担う組織(分析基盤組織)がどのように形を変えていったか」という内容です。組織設計の参考になれば幸いです。
Makots 2020/09/19
data

analytics

dena

architecture

analysis

organization

slides
リンク
食べログ3.8問題に終止符を打つ
import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import json import glob import math from pathlib import Path from collections import Counter from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix from sklearn.metrics import roc_auc_score from sklearn.model_selection imp
Makots 2019/10/16
gourmet

python

statistic

analysis

analytics
リンク
分析の基礎（モデリング）/ Basics of analysis ~modeling~
株式会社ブレインパッドの2019年新卒研修資料です。モデリングに関する基本的な内容を扱っています。
Makots 2019/09/07
analysis

analytics

machinelearning

modeling

slides

statistics
リンク
データレイク構築後の四方山話 #DPM / 20190905
Data Platform Meetup の登壇資料です。 https://data-platform-meetup.connpass.com/event/142822/
Makots 2019/09/06
data

analytics

infrastructure

analysis

machinelearning

slides
リンク
総務省 ICTスキル総合習得プログラム
このウェブサイトでは、ICT（情報通信技術）に関する教材の「総務省 ICTスキル総合習得プログラム」をオープンデータとして提供します。「総務省 ICTスキル総合習得プログラム」は、各5講座から成る4つのコース（[1]データ収集、[2]データ蓄積、[3]データ分析、[4]オープンデータ・ビッグデータ利活用事例）によって構成され、ICTに関する基礎知識・基礎技術を学ぶことができます。個々人の自学自習および学校・企業・コミュニティでの授業・勉強会にて、ご活用ください。総務省 ICTスキル総合習得プログラムこのウェブサイトでは、2017年度における総務省の事業として開発された「総務省 ICTスキル総合習得プログラム」に関して説明し、成果に関するファイルを提供します。このウェブページでは事業の成果であるIアイCシーTティー（Information and Communication Techn
Makots 2019/05/17
analysis

analytics

data

dmp

machinelearning
リンク
https://jp.techcrunch.com/2019/02/14/docean-openbeta/
Makots 2019/02/15
sns

data

analysis

analytics
リンク
(翻訳) データエンジニアの始まり - satoshihirose.log
訳者まえがき原著者 Maxime Beauchemin の許可を得て以下の記事を翻訳・公開しました。 medium.freecodecamp.org 原著者は、Apache Airflow や Apache Superset のクリエーターで、現在は Lyft で Data Engineer をしています。データエンジニアの始まり（翻訳）私は 2011 年にBIエンジニアとしてFacebookに入社しました。2013年に退職するときには、私はデータエンジニアでした。昇進もしくは新しい役割に就いたわけではありません。そうではなく、Facebookは、私たちが行っていた仕事が伝統的なBIを超えていたことに気づいたのです。私たち自身のために作り出した役割は、まったく新しい専門分野でした。私のチームはこの変革の最前線にいました。私たちは新しいスキル、新しいやりかた、新しいツール開発し、そ
Makots 2018/07/24
data

analytics

dataengineering

analysis

tools
リンク
1 2 次のページ