並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 13 件 / 13件

新着順 人気順

"* 主成分分析"の検索結果1 - 13 件 / 13件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

"* 主成分分析"に関するエントリは13件あります。 統計機械学習数学 などが関連タグです。 人気エントリには 『主成分分析(PCA)の数学的な理論とPythonによる実装』などがあります。
  • 主成分分析(PCA)の数学的な理論とPythonによる実装

    $$ \newcommand{\bm}[1]{\mathbf #1} $$ 主成分分析(PCA)の数学的な理論とPythonによる実装¶ Author: Yuki Takei (noppoMan) Github: https://github.com/noppoMan Twitter: https://twitter.com/noppoMan722 Blog: https://note.com/noppoman これは、noteの主成分分析の背景にある数学理論の話(最適化問題)の本文です。 主成分分析の数学的な理論の理解に必要な知識¶ 主成分分析は、アルゴリズム的な観点で見るとデータの分散を最大化させる最適化問題であり、その理論は数学(とくに微分学、線形代数)により与えられている。以下は、主成分分析で使われる数学の分野をざっくりとリストしたものである。 データ分析 分散、共分散 解析学 多

      主成分分析(PCA)の数学的な理論とPythonによる実装
    • 関数データに対する主成分分析 ~方法論の紹介とRによる実装~

      経時データが観測されたとき、各観測のデータを関数として扱いその特徴を定量化するための方法について紹介します。Rによる分析コードとその解説も入れています。 (p6の「こちらのページ」はp33を指しています)

        関数データに対する主成分分析 ~方法論の紹介とRによる実装~
      • 教師なし学習の実践 主成分分析で高次元データを可視化する - DATAFLUCT Tech Blog

        こんにちは!nakamura(@naka957)です。今回は、主成分分析(PCA)をご説明します。 主成分分析は教師なし学習の重要手法の1つです。教師なし学習は正解情報なしでデータのパターンを推測する手法です。その中でも、主成分分析は多数の特徴量を少数の特徴量で表現する手法です。言い換えれば、高次元のデータを低次元で表現するため、次元圧縮の手法とも呼ばれます。 本記事では、主成分分析の概要と実装例をご紹介します。実装例では、手書き数字の画像データを実際に次元圧縮してみます。手書き数字の画像データでパターンが観測されるか確かめてみましょう。 では、早速始めていきます。 主成分分析 実装例 データセットを準備 標準化でスケールを揃える 主成分分析の実行 結果の可視化 まとめ 参考 主成分分析 主成分分析(Principal Component Analysis: PCA)は、多数の特徴量のデー

          教師なし学習の実践 主成分分析で高次元データを可視化する - DATAFLUCT Tech Blog
        • 【バイオインフォマティクス】R言語でRNA−seqデータの主成分分析する方法【PCA】 - LabCode

          主成分分析(PCA)とは? 主成分分析とは、多次元データを低次元に次元圧縮する手法の一つです。主成分分析は、データの性質を最もよく表す要素を抽出することができるため、データの可視化やクラスタリングなどの機械学習手法を用いた分析にも活用されます。 RNA-seq解析では、主成分分析を使用することで、大量の発現データをより簡単かつ高速に解析することができます。主成分分析は、原発現データの次元圧縮を行い、主な発現変動のパターンを抽出します。これにより、大量の発現データを分かりやすく視覚化し、その結果をもとに遺伝子の発現変動や発現パターンを解析することができます。 Rを実行する準備 今回はRstudioを使ってRを実行していきます。 各OS環境を元にこちらのサイトよりインストーラーをダウンロードしてください。 https://cran.r-project.org/ インストールするバージョンは最新

            【バイオインフォマティクス】R言語でRNA−seqデータの主成分分析する方法【PCA】 - LabCode
          • みやさかしんや@Python/DX/エンジニア on Twitter: "文部科学省が無料で公開している「高校の情報IIの教員用教材」が超絶に有益✨🤗月曜から高校に通いたくなるレベル✨🏫 ・重回帰分析 ・主成分分析 ・クラスタリング ・ニューラルネットワーク ・テキストマイニング ・画像認識 など… https://t.co/xb60pwgE9u"

            文部科学省が無料で公開している「高校の情報IIの教員用教材」が超絶に有益✨🤗月曜から高校に通いたくなるレベル✨🏫 ・重回帰分析 ・主成分分析 ・クラスタリング ・ニューラルネットワーク ・テキストマイニング ・画像認識 など… https://t.co/xb60pwgE9u

              みやさかしんや@Python/DX/エンジニア on Twitter: "文部科学省が無料で公開している「高校の情報IIの教員用教材」が超絶に有益✨🤗月曜から高校に通いたくなるレベル✨🏫 ・重回帰分析 ・主成分分析 ・クラスタリング ・ニューラルネットワーク ・テキストマイニング ・画像認識 など… https://t.co/xb60pwgE9u"
            • 主成分分析が非線形データ扱えないっておかしくね? - Qiita

              1 主成分分析は線形手法? 世の中的には「非線形データを扱うときは主成分分析ではだめ」というのが通り相場になっている。しかし、Unsupervised Feature Extraction Applied to Bioinformaticsと題する本を昨年出版し、バイオインフォマティクスに主成分分析を用いた解析の論文を一杯出している僕としては「生命現象って非線形データの最たるものでは?」という思いがあり、内心、忸怩たる思いがある。主成分分析が非線形データ解析に適してないなら、なんで僕は一杯論文を書けたのか?そこで、ここでは簡単な例で「主成分分析が非線形データに弱い」というのは一種の「迷信」であることを主張したい。 2 円の主成分分析 まず円を考えよう。具体体には$x_{i1} = \cos \left ( 2 \pi \frac{i}{N} \right) \in \mathbb{R}^N

                主成分分析が非線形データ扱えないっておかしくね? - Qiita
              • 画像に関する主成分分析① 次元圧縮 - Qiita

                はじめに 主成分分析を使って、画像データの傾向を掴んだり、前景と背景に分離することになりました。 勉強したことを備忘のためにもここに書いていきます。 この記事で扱う内容 pythonのscikit learnのPCA(Principal Component Analysis)を使って主成分分析を実施し、低次元の主成分の空間に圧縮してみます。データとしては、ここでもMNISTを使ってみます。 MNISTの訓練データを使ってPCAを実施し、主成分の寄与率を求めてデータの75%ほどを説明できる次元数を求めます。そしてこの低い次元数に圧縮した画像を、訓練データとテストデータそれぞれで確認します。 また、第1主成分と第2主成分の二次元まで落として可視化して、0から9までの手書き文字がどのように分布するかを確認します。 実装 MNISTの読み込みと寄与率の確認 まずはMNISTデータを読み込みます。こ

                  画像に関する主成分分析① 次元圧縮 - Qiita
                • 【ChatGPT】主成分分析を活用したデータドリブンな組織開発をしてみよう_HR×Data Analytics×ChatGPT - Qiita

                  【ChatGPT】主成分分析を活用したデータドリブンな組織開発をしてみよう_HR×Data Analytics×ChatGPT機械学習データ分析HRTech組織開発ChatGPT はじめに こんにちは、今回はHR(人事)領域でのChatGPTを使ったデータ分析の事例をご紹介します。 そもそもQiitaにてどのくらい組織/人事領域が求められているかはわかりませんが、 「へぇ、こんな手法もあるんだ」と参考にしていただければ幸いです。 またあなたが人事や多くの組織を管掌する現場マネージャーであれば、 本記事の手法を活用することで、たとえデータ分析のスキルがなかったとしても 組織改善を効果的に進められるようになるのでご参考にどうぞ。 本記事では具体的には エンゲーメントサーベイ(従業員に回答してもらったアンケート)データを元に 主成分分析という機械学習の手法を用いて 組織の開発を行う そしてそれを

                    【ChatGPT】主成分分析を活用したデータドリブンな組織開発をしてみよう_HR×Data Analytics×ChatGPT - Qiita
                  • データで(主成分分析等で)振り返るM-1グランプリ2023 - Qiita

                    1.はじめに この記事は、NSSOL-アドベントカレンダー2023、2023-12-25担当分です。 先駆者の記事を参考に、M-1グランプリ2023の決勝ファーストラウンドのデータを利用して、主成分分析等を行い、理解度を深めます。出場者と審査員の特徴が捉えられたらいいな、と思います。 ↓の@haltaro さんの記事では、2017年までのデータにて分析が行われていました。M-1グランプリのルールや主成分分析の理論的背景まで説明されていて、大変分かりやすいです。是非読みましょう。 本投稿は、2023のデータでも同じことをやってみた、という内容です。データ・ソースコード等は↓、のkaggle-Datasetsに置いてあります。 関連記事を挙げます。↓は2018-2022年までの記事です。過去との比較用です。 2. M1グランプリ2023 2023年のM1グランプリのファーストラウンドの採点結果

                      データで(主成分分析等で)振り返るM-1グランプリ2023 - Qiita
                    • Python3ではじめるシステムトレード:主成分分析について考える - Qiita

                      統計検定準一級の22章は主成分分析ですが、内容はかなり詳細で理解に苦しみました。そこでまとめてみました。sympyのプログラミング、論理の整合性のチェックなどにChatGPT4(open AI)を使っています。いつも通り間違いがあると思いますので、ご指摘ただけると助かります。 関連するsympyのシートは https://github.com/innovation1005/qiita_innovation1005 また、日曜の朝9:30と火曜の午後7:00から勉強会を開いています。 https://study-data-analysis.connpass.com/ 参考文献は統計学実践ワークブックです。今回の投稿は22章に関するものです。 要約 平均 $n$個の個体があり、それは$p$個の変数で構成されているとします。 これらを $n \times p$行列としてまとめたものを$X$としま

                        Python3ではじめるシステムトレード:主成分分析について考える - Qiita
                      • データ分析をするなら読んでおきたいPCA(主成分分析)の書籍9選

                        最近、「データ」という言葉をメディアなどで見聞きすることが多くなりましたよね。現代でデータを分析して利用することはとても重要であり、その分析で使用されることが多い手法の1つがPCA(主成分分析)です。 データとは、さまざまなことを判断するための材料。インターネットの普及で、データの収集が以前よりもしやすくなりました。そして、集められたデータは分析されて、さまざまな分野で目的に合わせて活用されています。 例えばマーケティングでは、ある商品を購入した顧客の年齢・性別・購買履歴などのデータを収集し分析して、次の販売戦略に利用します。マーケティングには、さまざまな分析方法が使用されていますが、PCAもその1つです。 現代の企業内業務では、パソコンを使ったデータ分析の仕事が増えています。そのため、PCAについて知っておくと、とても仕事で役立ちます。そこで今回は、データ分析方法のPCAについて学べる書

                          データ分析をするなら読んでおきたいPCA(主成分分析)の書籍9選
                        • 次元削減とは?次元削減と主成分分析に関して学ぼう! - AI Academy Media

                          主成分分析(PCA)とは データセットの次元が多いと、データ分析においても、機械学習においても計算コストが増え、データの様子が分かりにくくなります。 その解決策として、統計や機械学習の分野でよく使われる手法が、主成分分析(Principal Component Analysis:PCA)です。 主成分分析では、特徴量を抽出することによって、データセット内の特徴量を削減することが出来ます。 それによって、3次元以下に次元を削減することが出来れば、データを可視化することもできます。 主成分分析では、特徴量を「選択」するものではなく、新しい特徴量を「抽出」します。 ただし、ここでいう「抽出」とは非可逆的な(一度抽出したら、元のデータセットの特長量には戻らない)ものなので、いくらか失われる情報が出てきます。 主成分分析を理解する 主成分分析とは、データセットの次元を削減するために用いる手法ですが、

                            次元削減とは?次元削減と主成分分析に関して学ぼう! - AI Academy Media
                          • ポケモンで多変量分析・主成分分析を始めよう! RとTableauの連携 - Qiita

                            2015年の秋にPokemon Goが発表され、世界的に社会現象となったポケモンですが、今もなお、子供にも、大人にも絶大な人気があります。 ポケモンのキャラクターがユニークでバラエティに富んでいるということが、人気の理由なのではないでしょうか。 私も全くのポケモン初心者だったのですが、ポケモン・データから何か面白い分析はできないかと試行錯誤しています。 世界的データサイエンスのコンペサイト:Kaggleで公開されているデータセットの中にはポケモンに関するデータが結構あるようです。データサイエンティストにとってPokemonは興味深い研究課題のようですね! ということで、今回はKaggleのデータセットからポケモンの属性データを主成分分析を使って、理解していこうと思います。 そもそも、ポケモンには、CP(Combat Point: 戦闘力)、HP(Hit Point:体力)、体重、身長 ・・

                              ポケモンで多変量分析・主成分分析を始めよう! RとTableauの連携 - Qiita
                            1

                            新着記事