[B! analysis][math] teddy-gのブックマーク

teddy-g id:teddy-g

analysisとmathに関するteddy-gのブックマーク (12)

因子分析をExcelで理解する - Qiita
主成分分析とは似て非なる手法として「因子分析」(Factor Analysis) があります。主成分分析(PCA)では、説明変数に対して重み行列（固有ベクトル）a を線形結合した「主成分」 yPC1を合成しました。ここで、主成分は、説明変数と同じ数だけ定義します。 yPC1 = a1,1 x1 + a1,2 x2 + a1,3 x3 + a1,4 x4 + a1,5 + ... 因子分析では、説明変数（観測変数）x が「因子」(factor) という潜在変数から合成されるという考え方に基づき、その因子得点 f と重み行列（因子負荷） w 、そして独自因子 e を特定します（主成分分析に独自因子という考え方はありません）。 x1 = w1,1 f1 + w1,2 f2 + e1 x2 = w2,1 f1 + w2,2 f2 + e2 x3 = w3,1 f1 + w3,2 f2 + e3
teddy-g 2023/10/14
因子分析をEXCELでやる方法…なんだけど、この通り進めていくと途中で手詰まりになる。おとなしくRかPython使った方が早い。

datascience

analysis

data

excel

math

statistics

stats
リンク
フィボナッチを使ったテクニカル分析で相場の反転を見抜く方法 | 投資の教科書
フィボナッチとは、イタリアの数学者のレオナルド・フィボナッチが唱えた「フィボナッチ数列」のことです。相場の世界では、フィボナッチ数列を応用した「フィボナッチ・リトレースメント」というテクニカル分析があり、フィボナッチ比率に基づいた23.6%、38.2%、50.0%、61.8%、76.4%の比率に注目すると、値動きが読みやすくなります。いわば、このフィボナッチは、価格の「支持帯」と「抵抗帯」を予測するテクニカル分析の一つです。特にFXでは、トレンドが発生しても一直線に進み続けることはなく、必ず上下動しながら、「押し目」と「戻し」を形成します。そして、フィボナッチを使うと、押し目や戻しがどこで発生するかが予測しやすくなります。そこで、この記事では、フィボナッチの引き方や基本的な役割を説明し、その後、どのような使い方で利益を出すのか、トレード戦略まで具体的に解説しています。ぜひ参考にして
teddy-g 2021/01/20
上昇トレンドという言葉を英語に直そうとしてたらフィボナッチ数列とテクニカル分析のネタに行き当たった。実証できるかな。

neta

math

analysis

stockmarket
リンク
Difference between Topological Data Analysis and Graph Technology
teddy-g 2017/03/31
TDAと（Oracleの）グラフ技術の違いは何よ？って質問にGurjeetとAnthonyが回答してる。TDAは別空間に写像するからより汎用的という話。

math

bigdata

TDA

topology

data

analytics

analysis
リンク
判別分析（マハラノビス）
トップページ→研究分野と周辺→システムの評価→ 例えば二次元で考えると、x軸y軸平面に多数の点が散らばり、これが幾つかのグループに分かれているとする。判別分析では、新たな点が与えられたとき、どのグループに属するかを判別する。判別分析には、幾つかの方法があり、「サポートベクターマシン（SVM）」のように区分する線を引く方法もある。ここでは、マハラノビス距離を用いた判別分析について述べる。マハラノビス距離最も一般的に使われる距離はユークリッド距離である。一次元（例えばx軸上）では、x座標の差がそのまま距離となる。例えば二つのグループがあるとき、新たな点が与えられてどちらのグループに属するかを判別する際、新たな点のx座標と双方のグループの中心とのユークリッド距離を測り、短い方に属すると考える事も出来る。しかし、この方法では、以下のような場合に問題となる。青い点と赤い点の二つのグルー
teddy-g 2017/01/11
[unsupervisedlearning]マハラノビス距離に関し、２変数の場合が丁寧に説明してある。

bigdata

data

analysis

analytics

statistics

stats

math

anomalydetection
リンク
尤度の解説
このドメインはお名前.com から取得されました。お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年10月時点の調査。
teddy-g 2017/01/03
ある観測データの下での仮説の確からしさが尤度。H0とH1の尤度の比がロッド値で、どっちが確からしいかを見るのに使う。

statistics

stats

math

bayes

bayesiannetwork

data

analysis

analytics

bigdata
リンク
【統計学】正規分布とカイ二乗分布の関係を可視化してみる。 - Qiita
統計学、可視化してみるシリーズの続編です。カイ二乗分布は、ABテストのカイ二乗検定等でよく使う分布です。$\chi^2$と書いてカイ二乗です。グラフにすると下記のような形で、自由度と呼ばれるkの値に応じて形が変化します。 (グラフ描画のコードはこちら) 今回もWikipedia先生にカイ二乗分布の定義を聞いてみると、独立に標準正規分布に従う $k$ 個の確率変数 $X_1, ..., X_k$ をとる。このとき、統計量$$Z = \sum_{i = 1}^k X_i^2$$の従う分布のことを自由度 $k$ のカイ二乗分布と呼ぶ。という返事が返ってきました。うーん、どういうこと？正規分布の密度関数を２乗するの？どうやら違うようです。まず、「独立に標準正規分布に従う $k$ 個の確率変数」ということなのでまずは標準正規分布に従う乱数のヒストグラムを書いてみようとおもいます。30,0
teddy-g 2017/01/03
カイ二乗分布と正規分布の関係がビジュアルに理解できる。正規分布の対数から計算されるマハラノビス距離が自由度＝次元数のカイ二乗分布に従うのも納得。

statistics

stats

math

data

bigdata

analysis

analytics

anomalydetection
リンク
http://kamiyacho.org/ebm/ce201.html
teddy-g 2016/12/28
k統計量、k検定、カッパ値の説明。(Po-Pe)/(1-Pe)で偶然起きない一致を評価する。機械学習の精度検定にも使える。

statistics

analysis

bigdata

datascience

math
リンク
MLAC2013 数式を使わずイメージで理解するEMアルゴリズム - Wolfeyes Bioinformatics beta
はじめに Machine Learning Advent Calendar 2013の15日目を担当する@yag_aysです．専門はバイオインフォマティクスという計算機を使って生物学をする分野で，生モノではなく遺伝子の文字列相手に格闘している大学院生です．今回は初心者の人を対象に，なるべく数式を使わずにEMアルゴリズムについて解説してみたいと思います． EMアルゴリズムは，SVMやニューラルネットワークといった華々しい機械学習の手法の一つではなく，機械学習の中で使われる尤度最大化という一部分を担当するアルゴリズムです．そのため多くの人にとってEMアルゴリズムは，それ単体を使ってみたりだとか独自に改良をしたりするような対象ではないでしょう．でも，EMアルゴリズムなんて仰々しい名前が付けられているだけあって，いざ自分の仕事に組み込む場合には中身を理解していないと「なぜEMアルゴリズムを使ったの
teddy-g 2016/12/07
何という簡潔で明解な解説。EMアルゴリズムって何？と人に聞かれても説明できるな

machinelearning

math

advancedanalytics

analysis

analytics
リンク
行列の固有値・固有ベクトルの定義と具体的な計算方法 | 高校数学の美しい物語
Axundefined=λxundefinedA\overrightarrow{x}=\lambda \overrightarrow{x}Ax=λx が成立するとき xundefined\overrightarrow{x}x を AAA の固有ベクトル(英：eigenvector)，λ\lambdaλ を AAA の固有値(英：eigenvalue)と言う。ただし，AAA は正方行列，xundefined\overrightarrow{x}x は 0undefined\overrightarrow{0}0 でないベクトル，λ\lambdaλ はスカラー。
teddy-g 2015/12/07
Eigenvector & Eigenvalueの説明。オイゲンの綴りはEugenだから別物。

math

bigdata

analysis

advancedanalytics

topology
リンク
マインドウエア総研 | 技術情報　|　SOMデータマイニング解説
SOMのマップを見るときに重要なポイントは、各属性（変数）の値が、マップの領域でどのように分布しているかということです。領域ごとに、どの属性の値が高いか？低いか？を見ます。マップの可視化によって、直観的にそれを判断できるのがSOMの強みでもありますが、反面、可視化のみに頼った分析では定量的な分析ができません。Viscoveryでは、SOMのマップ上で定量的な分析もできるように改良されておりますが、Viscovery以外のSOMでは可視化に頼りすぎる点が最大の欠点でもあります。初心者がSOMのマップを見たときに最もよく出る疑問は、「マップの縦と横は何？」ということなんですが、SOMはデカルト座標の縦軸・横軸を意味しておりません。前のページで述べたように、多次元空間内でデータが分布している密度の高いところに、2次元の柔軟な格子を沿わせて自由曲面を形成しています。SOMのノードは、多次元空間で
teddy-g 2015/06/08
SOMを使ったソフトなんてあったんだな。広い意味ではSOMもTopologyと同じカテゴリ。

bigdata

analytics

analysis

topology

math

SOM
リンク
なるほど統計学園高等部 | ローレンツ曲線
特徴ローレンツ曲線はある事象の集中の度合いを示す曲線で、所得や貯蓄の格差などを示す時に有効なグラフです。ローレンツ曲線は階級ごとに集計された数値を使用します。階級値の小さい方から順に並べ、横軸に、各階級の度数（人数など）を全体の度数で割った「相対度数」を累積して並べた累積相対度数をとり、縦軸に、階級値と度数を掛け合わせ、全体に占める割合を累積していった値（累積配分比率）をとります。中央の斜線は均等配分線といい、階級ごとの人数が同じになることなどにより、完全に均等に配分された場合を表しています。作成方法データを使用してローレンツ曲線を作成してみましょう。 ① まず、横軸の累積相対度数を算出します。下図のように階級の小さい順に累積度数を作成します。 ② 全体の度数で各階級の度数を割った累積相対度数を算出します。作成されたグラフが原点を通るよう、先頭に「0」の値を入れておくとよいでし
teddy-g 2015/05/20
ディシジョンツリー（CART）で出てくるジニ係数を分かりやすく説明してある。ふむふむ。

analysis

analytics

bigdata

math

statistics
リンク
ホモロジーとホモトピーの違いって何ですか？ - 佐藤肇先生の『位相幾何』（岩波書店）の冒頭にはこう書かれています。「位相幾何は、つながっ... - Yahoo!知恵袋
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1343207768 佐藤肇先生の『位相幾何』（岩波書店）の冒頭にはこう書かれています。「位相幾何は、つながっているか、離れているかという本質的な違いのみを見つけていろいろな図形を分類する。図形の穴の数を１コ、２コと数えるのは一つの表現であろう。また穴とは何で、穴の数はどのように数えられるものであろうか。実は、それを数学的に説明するのがホモトピー群、ホモロジー群、コホモロジー群であり、さらに図形の曲がり具合の程度を表すのが特性類である。直感的にいえば、i次元のホモトピー群は、i次元の“丸い穴”の様子を見ており、i次元のホモロジー群は、i次元の“部屋”の数を調べているということができるであろう。」位相幾何の入門でまず勉強するのはホモロジーと基本群ですね。基本群はホモトピー
teddy-g 2015/02/08
でもってホモロジーとホモトピーの違いとは何かと。ホモロジーで考えた方がいい。たぶん。

analytics

advancedanalytics

analysis

topology

homology

homotopy

manifold
リンク
1