タグ

プロットに関するwerdandiのブックマーク (6)

  • A/Bテストの時間短縮に向けて 〜ベイズ統計によるA/Bテスト入門〜 - Gunosyデータ分析ブログ

    はじめに こんにちは、19卒でGunosy Tech LabのBIチームの齊藤です。 data.gunosy.io この記事はGunosy Advent Calender 2019の4日目の記事です。昨日の記事は高橋さん(@tkhs0604)によるプロダクトマネージャーカンファレンス2019 参加レポート でした。 はじめに 背景 ベイズ統計 例: 継続率 事後分布のプロット 継続率以外の指標は? おわりに 背景 GunosyではUI・ロジックの変更等を行う際にA/Bテストにより効果検証を行っています。 data.gunosy.io 上記のブログの通り、従来の(頻度論に基づく)仮説検定ではA/Bテストを開始する前に有意水準、検出力、効果量を定めてサンプルサイズを求めなければなりません。またサンプルサイズを定めても必要なサイズを満たすのに何日かかるかも不透明であり、施策の実行→A/Bテスト→

  • 中学生でもこれだけで完全理解する機械学習 Part 1 - Qiita

    今から使う文字の定義をしていきます。 m ・・・ケースの数です。上記のデータセットでは8 x ・・・土地の面積です。xi で、i番目の土地の面積を表します。x2 = 1416 y ・・・土地の価格です。yiで、i番目の土地の価格を表します。y4 = 178 h・・・仮説(hypothesis)を意味する略語です。 4-2 仮説の表現方法を決める 仮説hを表現する表現式を作ります。それがこちら。 hθ(x) = θ0 + θ1x ちなみにこれは、一見難しそうですが、中学生でやる一次関数の式、Y = B + AX と酷似しているのがわかるでしょうか。一次関数は、下のようなグラフですから b → θ0 a → θ1 となっているだけだとわかります。 そしてhθ(x)が、直線を示しています。 一番詰まりやすいところですから、ここだけは暗記して欲しいです。 5 コスト関数(目的関数) 5-1 そもそ

    中学生でもこれだけで完全理解する機械学習 Part 1 - Qiita
  • Python でデータ分析するのに適したグラフツール3選

    概要 Python でのデータ分析作業に向いたグラフ作成ツールの機能比較です。Python のグラフ作成ツールといえば matplotlib ですが、正直言って煩雑な構文で、こういった作業に向かないと思います。そこで、今回は使えそうな以下の3つ+α1のパッケージについて、大雑把に紹介します。 plotnine altair seaborn (pixiedust) グラフ作成ツールに求められる要件 サンプルコードと結果だけ見たい場合はここは読み飛ばしても問題ないです。 たとえば pandas-profiling はデータフレーム内の全ての列に対して記述統計量をとり、簡易的なヒストグラムなんかも表示してくれますが、多くの場合それだけでは不十分です。高次元のデータから変数間の関係を読み取ることを意図していました。いわゆる探索的データ解析 (EDA) に近いものだと思います2。変数どうしの関係を様

    Python でデータ分析するのに適したグラフツール3選
  • べき乗則・パレート分布・ジップの法則

    Layer Normalization論文の紹介スライドです https://arxiv.org/abs/1607.06450 間違い等ありましたらご指摘いただけると嬉しいです スライドは、弊社の梅により弊社内の技術勉強会で使用されたものです。 近年注目を集めるアーキテクチャーである「Transformer」の解説スライドとなっております。 "Arithmer Seminar" is weekly held, where professionals from within and outside our company give lectures on their respective expertise. The slides are made by the lecturer from outside our company, and shared here with his/her

    べき乗則・パレート分布・ジップの法則
  • ggplot2 の自分用メモ集を作ろう - Triad sou.

    プロットの作製 基プロットを作る Geoms Aesthetics 違う種類のグラフを重ねる 参照線の追加 グループ分け 層別プロット スケールと軸 Scales 軸ラベルやタイトルの変更 軸の表示範囲を変更する 軸の左右の余白を削除する 軸表示の修飾 日時の軸スケール 軸区切り値の変更 軸スケールの変更 (変数変換) プロットのソート (離散型変数の水準をソートしてプロット) 座標系の反転:横向き箱ひげ図 極座標への変換:円グラフ 座標系のアスペクト比の指定 色セットの変更 ggplot2 のデフォルト色セットの定義 任意の色セットの利用 凡例 凡例位置の変更 凡例ラベルの変更 凡例の一部を削除する テーマ (グラフ背景・グリッドの色, マージン, フォント) Themes 定義済み theme の適用と編集 theme 要素と theme() の併用時の注意点 フォント変更 保存 g

    ggplot2 の自分用メモ集を作ろう - Triad sou.
  • Rで解析:データの特徴を一気に確認。「GGally」パッケージ

    「ggplot2」パッケージを利用して多変数の特徴をプロットすることができるパッケージの紹介です。データの解釈に非常に便利なパッケージかと思います。また、複数のggplotオブジェクトのプロットが可能な「ggmatrix」コマンドも収録されています。 パッケージバージョンは2.1.2。実行コマンドはwindows 11のR version 4.1.2で確認しています。 パッケージのインストール下記、コマンドを実行してください。 #パッケージのインストール install.packages("GGally")実行コマンド詳細はコメント、パッケージのヘルプを確認してください。 #パッケージの読み込み library("GGally") ###データ例の作成##### n <- 50 TestData <- data.frame(Group = sample(paste0("Group", 1:

    Rで解析:データの特徴を一気に確認。「GGally」パッケージ
  • 1