サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ニコニコ動画
bellcurve.jp
Excelの機能だけでロジスティック回帰分析を実行する方法を解説します。 Excelの関数や「分析ツール」では、回帰分析や分散分析を行う機能が搭載されていますが、ロジスティック回帰分析は搭載されていません。 しかし、ロジスティック回帰分析の原理についての知識があれば、ソルバーを用いて最尤法によるロジスティック回帰分析を行うことができます。 ただし、今回紹介する方法は、求められた解が100%正しい保証がなく、偏回帰係数の検定を行うことが出来ないことに注意してください。正しい解を求められるかについては、使用するデータや分析に使用するソルバーの性能に依存します。 この方法では、計算の途中でソルバーを使用します。ソルバーが有効になっていない場合は『ソルバーを有効にする手順』によってソルバーを使用できるよう設定してください。 Excel 2013を用いて解説していますが、ソルバーが使用可能であれば別
いくつかの袋の中に赤い玉と白い玉がいくつか入っています。これらの袋のうちどれか1つの袋から、いくつかの玉を取り出したとします。この取り出された玉の色(結果)から、どの袋から取り出されたものか(原因)を推定することを考えます。ここで用いるのが「ベイズの定理」です。 事象Aが起こるという条件のもとで、k種類の事象:ただしこれらは互いに排反とするが起こるとします。このとき、事象Aが起こるという条件のもとで、事象が起こる条件付き確率は次の式から求められます。
■ベルヌーイ試行 「コインを投げたときに表が出るか裏が出るか」のように、何かを行ったときに起こる結果が2つしかない試行のことを「ベルヌーイ試行」といいます。ベルヌーイ試行では一般に、2つの結果のうち一方を「成功」とし、確率変数がとる値を「1」、もう一方の結果を「失敗」とし、確率変数がとる値を「0」とします。そして成功の確率をとすると、それぞれの確率は次のように表されます。 ■二項分布 このベルヌーイ試行を回行って、成功する回数が従う確率分布を「二項分布」といいます。また、が二項分布に従うとき、「」と書きます。やは確率分布を特徴づける値であり、「パラメータ(母数)」と呼ばれます(分母や母集団の大きさのことを母数というのは誤りです)。 回のベルヌーイ試行を行うときにちょうど回成功する確率、すなわちとなる確率は次の式から計算することができます。
■パーセンタイル 箱ひげ図の見方を説明する前に、「パーセンタイル」について触れます。パーセンタイルは「データを小さい順で並べたとき、ある数値がデータの小さい方から見て何%の位置にあるかを表すもの」です。0パーセンタイルは最小値を、100パーセンタイルは最大値を表します。Nパーセンタイルは、データ全体をN%と100-N%で分割する値です。 例えば、4‐1章の15人分の体重のデータを用いて30パーセンタイルを表すと、次のようになります。 ■四分位数 箱ひげ図には最大値、最小値に加えて「四分位数」の情報が含まれています。四分位数はデータを小さい順に並べて、小さいものから順位を付けた時に、 25%(全体の1/4の部分)=25パーセンタイル 50%(全体の2/4=1/2の部分)=50パーセンタイル 75%(全体の3/4の部分)=75パーセンタイル に該当する値のことです。
いずれかの袋から玉を1つ取り出したところ、白い玉でした。この玉が袋2から取り出された確率は、袋2から玉を取り出す事象を事象、取り出した玉が白色である事象を事象Aとすると、ベイズの定理より次のように計算されます。(10‐4章より) ■事前確率 この計算では、取り出された袋が分からない、すなわち玉がまだ取り出されていないとき、袋2から玉を取り出す事象の確率をとしています。これは、袋1、2、3の中からいずれか1つの袋を選ぶ確率は等しいということに基づきます。この確率は「事前確率」と呼ばれます。「事前」とは「事象Aが起こる前」ということを意味します。 ■事後確率 いずれかの袋から玉を1つ取り出したところ白い玉であった場合に、袋2から玉が取り出された確率はとなりました。この確率は、「事象Aが起きた後」の、袋2から玉を取り出す事象の確率であることから「事後確率」と呼ばれます。 例題: あるUSBメモリ
統計学では、「説明変数」という言葉と「目的変数」という言葉が頻繁に出てきます。 例えば、バネにおもりを付けてバネがどのくらい伸びたかをグラフにプロットすると次のようになりました。横軸はおもりの重さ、縦軸はバネの伸びた長さを表します。 このときの横軸の「おもりの重さ」が「説明変数」、縦軸の「バネの伸びの長さ」が「目的変数」です。説明変数を、目的変数をとするとのような形で表すことができます。 別の表現をすると、説明変数は「何かの原因となっている変数」のことで、目的変数は「その原因を受けて発生した結果となっている変数」のことです。 説明変数と目的変数には下記のようないくつかの表現があります。 ■説明変数 x 説明変数 explanatory variable 予測変数 predictor variable 独立変数 independent variable ■目的変数 y 目的変数、応答変数、反
統計学の時間 統計学の基礎から応用までを丁寧に解説しています。「Step1. 基礎編」は、大学で学ぶ統計学の基礎レベルである統計検定®2級の範囲をほぼ全てカバーする内容となっています。最後まで読み進めることで、統計検定®2級に合格できる力がつくことを目標にしています。 学習ページは、数式ばかりではなく具体例を多数掲載し、はじめて統計学を学ぶ方にもイメージしやすい内容になっています。学習ページで勉強した後は、練習問題で腕試しができます。練習問題のすぐ下に解説を掲載していますので、理解度をすぐに確認することができます。 一通り勉強して知識が身に着いたら、実際に統計検定®を受験するのがオススメです。 統計WEBでは、統計検定®の受験者を応援しています! ※統計WEBを使って統計検定®に合格された方の『合格者の声』をブログに掲載しています。こちらからご覧ください。 Step0. 初級編 1. デー
仕様 数値はすべて正の値である必要があります。 ひげの数値がない場合は空欄としてください。 外れ値には対応していません。 変数の数を増やす場合、変数の名前が書かれた列の上で右クリックし、「コピー」を選択した後、再度同じ列を右クリックし「コピーしたセルの挿入」を選択してください。最後に増やした変数の名前やデータ値を変更してください。もし箱ひげ図の枠線や中央線が表示されなくなってしまう場合、「データ系列の書式設定」の「枠線」で「線(単色)」を選択してください。 変数の数を減らす場合、削除したい変数の列を選択後、右クリックし[削除]を選択してください。 ※ 変数の数を増やした際に他の変数の箱と色が異なる不具合を修正しました(2015年1月20日)。 ※ 変数の数を増やす手順がわかりづらかったため修正しました(2024年5月17日)。 ※ 変数の数を増やした際に箱ひげ図の枠線と中央線が表示されない
※ このコンテンツは「エクセル統計(BellCurve for Excel)」を用いた解析事例です。 分析データ 下図のデータは、野球選手20人について球速、遠投、懸垂、握力を測定した結果です。エクセル統計を用いて重回帰分析を行い、球速に影響を与える要因とその影響度を調べます。 ダイアログの設定 まず、データ範囲のラベルを選択します。目的変数のラベル「球速」(C3)を選択後、[Ctrl]キーを押しながら説明変数のラベル「遠投」「懸垂」「握力」(D3:F3)を選択します。
このページでは、データに対応がない場合と対応がある場合について、比率の差の検定を行うことができます。必要な数値を入力し、キーボードで[Enter]キーを押すと、結果が表示されます。 対応のないデータの場合 あるテレビ番組の視聴率を2つの地域で比較する場合など、2つの異なる標本に対し1つの項目の比率の差を検定します。
赤池の情報量規準(AIC)の計算方法を紹介します。 概要 赤池の情報量規準(以下AICとします)は、モデルのあてはまり度を表す統計量です。値が小さいほどあてはまりが良いとされますが、相対的な評価として用いられるため、「○以下であることが望ましい」というような基準はありません。 ここでは、統計解析事例の重回帰分析の結果を用いてAICを求めます。 定義 回帰式に定数項を含む場合、以下の式で定義されます。
※ このコンテンツは「エクセル統計(BellCurve for Excel)」を用いた解析事例です。 分析データ 下図のデータは、女性の肺癌患者108名、対照群108名を選出し、喫煙歴について調査した結果です。 分析の目的 肺癌の有無と喫煙歴の有無との関係を調べます。 データラベルの選択 セル「C3」を選択後、[Ctrl]キーを押しながらセル「D3」を選択します。
Excel の関数やピボットテーブルを用いて単回答を集計する方法を紹介します。なお、ページ下部で解説に用いたExcel ファイルをダウンロードすることができます。 概要 単回答形式の質問では、回答者はもっともあてはまると思う選択肢を1つ回答します。単一回答、単数回答と呼ばれることもあります。英語では Single Answer、略してSAです。回答データは選択肢の番号(カテゴリーコード)で、1から始まる整数になります。各整数の件数を数えることが単回答の集計となります。 集計に用いるデータ 回答データの例として、「高校生の生活調査」を200人を対象に行った結果を用います。なお、データは架空の値です。 ここでは、上図の「Q1.あなたは、どのようにして学校に通っていますか?」の回答データをExcel 2010を用いて以下の3種類の方法で集計します。 COUNTIF関数を用いる場合 DCOUNT関
エクセル統計は、Excelのメニューに統計解析の手法を追加する統計解析ソフトです。 分散分析や多重比較、ロジスティック回帰分析、カプラン=マイヤー曲線、ROC曲線など、分析によく用いられる手法をすぐに使い始めることができます。 エクセル統計が選ばれる5つの理由 1. 操作が簡単 Excel上のデータをそのまま統計解析でき、直感的に使用できます。スクリプトやコードの入力は不要です。使い方を習得するための時間がほとんどかかりません。 2. 低価格 エクセル統計の通常版は、4年間・PC1台の使用料が約4万円です。エクセル統計と同様の機能を同じ期間利用する場合、A社製品では約17万円、B社製品では約28万円、C社製品では約70万円となります。(他社製品価格は弊社調べによる参考価格です。) 3. 純国産 エクセル統計は、1995年に販売を開始した日本社製の統計解析ソフトです。メニューや出力、ヘルプが
重複を除いてデータの件数、すなわちデータの種類を、Excel の関数を用いて求める方法を紹介します。 概要 ここでは、以下のような動物の名前が入力されたセル範囲を対象に、動物が何種類含まれるかを調べます。 「データの種類を求める」という関数そのものはありませんが、複数の関数を組み合わせることでデータの種類を求めることができます。その方法として2つの方法を紹介します。 方法1 SUMPRODUCT関数とCOUNTIF関数を用いて求めます。
移動平均の計算方法を紹介します。 概要 移動平均とは、時系列データにおいて、ある一定区間ごとの平均値を区間をずらしながら求めたものです。移動平均を用いてグラフを作成すると、長期的な傾向を表す滑らかな曲線が得られます。移動平均の計算方法は区間が奇数か偶数かによって異なります。 区間が奇数の場合 区間を2n+1(n≥1)とすると、第a期(a≥n+1)の移動平均値は、第a−n期から第a+n期の平均値となります。例えば、区間が3の場合の第9期の移動平均値は、第8期から第10期(8・9・10)の平均値となります。は期のデータを、は期の移動平均とおくと、移動平均の計算式は次のように表せます。
2行×2列のクロス集計表から求めることのできる統計量にはいろいろなものがあります。 入力フォームの合計以外の4つのセル(a、b、c、d)に度数を入力して[計算]ボタンを押すと計算結果のフォームに結果が表示されます。度数の合計が1万件以下の場合に結果を表示します。
関連サイト紹介 目次 統計学の歴史 公的な統計資料 世界の統計 データアーカイブ 統計教育・研究 資格認定 学会 個人情報の保護 統計解析ソフトウェア 社会情報サービスのホームページ 統計学の歴史 The R.A. Fisher Digital Archive フィッシャーが晩年をすごしたアデレード大学が運営するフィッシャーのデジタル図書館 Materials for the History of Statistics ヨーク大学数学部による統計学史のWebサイト。統計学史を飾った著名な論文を読むことができる 公的な統計資料 e-Stat 政府統計の総合窓口。2008年度から本運用を開始した 総務省統計局 国勢調査など省庁が行っている統計調査の結果が掲載されている 国立社会保障・人口問題研究所 日本の将来推計人口や社会保障国際比較統計などの資料が公開されている 独立行政法人 労働政策研究・
Excel の関数を用いて複数回答を集計する方法を紹介します。なお、ページ下部で解説に用いたExcel ファイルをダウンロードすることができます。 概要 複数回答形式の質問では、回答者があてはまると思う選択肢が複数選ばれます。回答データは、選択肢と同じ数の列数とサンプルサイズと同じ数の行数のセル範囲に0または1で入力されます。0は回答者がその選択肢を選ばなかったことを、1は選んだことを表します。各選択肢の該当者数は、各列の数値の合計を求めることで集計できます。 集計に用いるデータ 回答データの例として、「高校生の生活調査」を200人を対象に行った結果を用います。なお、データは架空の値です。 ここでは、上図の「Q3-SQ.朝食を摂らない理由は何ですか?」の回答データをExcel 2010を用いて集計します。この設問は、「Q3.平日は、毎日、朝食を摂っていますか?」で「いいえ」と回答した人のみ
「エクセル統計でコンジョイント分析はできますか?」というお問い合わせをいただくことがあります。 残念ながら、2018年現在、エクセル統計には「コンジョイント分析」というメニューはありません。しかし、最もベーシックな方法で行うコンジョイント分析は、エクセル統計の機能を組み合わせることで実行できます。 以下では、エクセル統計でコンジョイン...
※ このコンテンツは「エクセル統計(BellCurve for Excel)」を用いた解析事例です。 分析データ 下図のデータは、自己肯定意識についての12の質問に対する200人の回答結果です。これらの質問が自己肯定意識のどのような側面をあらわしたものか、エクセル統計を用いて因子分析を行い共通因子を抽出します。 ※ このデータは、実際のアンケートの結果ではなく架空のデータです。「自己肯定意識尺度(平石賢二、1990)」を参考に項目を構成しました。 12の質問の詳細は以下の通りです。 01.自分の夢を叶えようと意欲に燃えている 02.前向きの姿勢で物事に取り組んでいる 03.自分の良い面を一生懸命伸ばそうとしている 04.自分には目標というものがない 05.生活がすごく楽しいと感じる 06.充実感がある 07.自分の好きなことがやれていると思える 08.自分はのびのびと生きていると感じる 0
※ このコンテンツは「エクセル統計(BellCurve for Excel)」を用いた解析事例です。 分析データ 下図のデータは、統計学の試験を26人に行った結果です。エクセル統計を用いて二項ロジスティック回帰分析を行い、統計WEBの閲覧経験と試験勉強に費やした時間が試験の合否に与える影響を調べます。 ダイアログの設定 まず、データ範囲のラベルを選択します。目的変数のラベル「試験結果」(C3)を選択後、[Ctrl]キーを押しながら説明変数のラベル「閲覧経験」「勉強時間」(D3:E3)を選択します。
Excel 関数による行列の転置・積・逆行列・行列式の計算方法を紹介します。 概要 Excel には行列の転置や積、逆行列の計算を行う関数が用意されています。行列の計算を行う関数は、引数と戻り値が配列(複数のセルからなる範囲)であり、配列数式と呼ばれます。 行列の転置 行列の転置(行列の入れ替え)を行う関数はTRANSPOSE関数です。元の行列の大きさが3行2列の場合、2行3列のセル範囲を選択した状態で下記のように数式を入力し、[Ctrl]+[Shift]+[Enter]を押すと結果が得られます。 行列の積 行列の積を計算する関数はMMULT関数です。2つの行列の積で求まる行列の大きさに等しいセル範囲を選択した状態で下記のように数式を入力し、[Ctrl]+[Shift]+[Enter]を押すと結果が得られます。 逆行列 逆行列を計算する関数はMINVERSE関数です。求まる逆行列の大きさに
Excel を用いてエラーバー(高低線)付き折れ線グラフを作成する方法を紹介します。 概要 Excel では「誤差範囲」の機能を用いて棒グラフや折れ線グラフにエラーバーを表示することができますが、このページでは、折れ線グラフでのみ利用できる「高低線」という機能を用いてエラーバーを表現します。「高低線」を用いることで少ない手順で作成でき、上下のエラーバーが系列名として凡例に表示されます。 手順は1から9まであり、下図のようなグラフをExcel 2016を用いて作成します。 データの作成 1. 下図のデータは、2009年の東京都東京の1日の平均気温・最高気温・最低気温について、月ごとに平均値を求めた値です。 ※ 参照:気象庁 > 気象統計情報 > 過去の気象データ検索
Excelを用いてエラーバー(誤差範囲)付き棒グラフを作成する方法を紹介します。 対応Excelバージョン この手順は、Excel 2016・2019・2021、office 365に対応しています。 概要 論文などで棒グラフにエラーバーを付け加えたグラフをよく見かけます。このグラフは、棒グラフで平均値を、エラーバーで標準誤差や標準偏差、平均値の信頼区間などを表します。ここでは、平均値に標準誤差のエラーバーを付けた下図のようなグラフを作成します。手順は1から12まであります。
Excel の棒グラフを用いて箱ひげ図を作成する方法を紹介します。 棒グラフを用いて箱ひげ図を自動作成するExcel シートのダウンロードはこちら → 箱ひげ図自動作成Excelシート 概要 箱ひげ図とは、データの分布やばらつきをわかりやすく表現するための統計学的グラフです。長方形の箱とその両端から伸びるひげで表現されることからこのような名前が付けられています。 箱ひげ図は、データの母集団の確率分布のタイプに関わらず、データの分布を表現することができます。 このページでは、最小値、第1四分点、中央値、第3四分点、最大値を用いて下図のような箱ひげ図を作成します。手順は1から15まであります。 データの作成 1. 下図のデータは、2010年のセ・リーグの6球団の100打席以上の選手の打率です。このデータを用いて箱ひげ図を作成します。 ※ 参照:プロ野球データFreak 箱ひげ図データの作成 2
※コラム「統計備忘録」の記事一覧はこちら※ クロス集計表の分析というと、カイ二乗検定しか思い浮かばない人も多いかと思いますが、私が知っているだけでも、20種類を超える統計量や多変量解析があります。この統計WEBのメインページにも、2×2のクロス集計表から計算可能な各種の検定や統計量が全部で12個載っており、入力フォームの集計表の各セルに任... ※コラム「統計備忘録」の記事一覧はこちら※ 集計ソフトの特徴が最も顕れるのは多重回答の扱いです。多重回答とは、アンケートで「この中から、あてはまるものをすべてに〇を付けてください」という質問に対する回答です。複数回答とも言います。英語ではMultiple answerですから、略してMAと言います。これに対し、「1つだけ〇を付けてください」とい... ※コラム「統計備忘録」の記事一覧はこちら※ 統計ソフトでも集計ソフトでもスプレッドシート状のウィン
エクセル統計は、実験データの解析だけでなく、アンケートなどによる調査結果、社会統計、ビジネスデータなど様々なデータの解析に利用できます。要因分析だけでも、ノンパラメトリック検定を含む各種検定から、重回帰分析、ロジスティック回帰分析、Cox比例ハザードモデルなどがあり、あらゆるデータのタイプに対応しています。このほか、コレスポンデンス分析や因子分析、ROC曲線など、130を超える機能を搭載しています。
※コラム「統計備忘録」の記事一覧はこちら※ ジーニアス英和大辞典によると sample の語源は、中世にイングランドを征服したノルマン人が使っていたアングロノルマン語の assample (見本 = example)。のちに、頭の as が消えて sample になったそうです。さらに遡ると、ラテン語の exemplum に行き着きます。example の原義は、「ex(外へ)+ample(広... ※コラム「統計備忘録」の記事一覧はこちら※ Excelのヘルプから標準偏差を計算する関数を調べると、6つもの関数が見つかります。 STDEV、DSTDEV、STDEVA、 STDEVP、DSTDEVP、STDEVPA 頭にDが付く2つの関数はデータベース関数、末尾にAが付くのは文字列や論理値を含むデータを計算するための関数です。したがって、この6つの関数はSTDEV系とSTDEVP... ※コ
次のページ
このページを最初にブックマークしてみませんか?
『BellCurve(ベルカーブ)─統計解析ソフト・アンケート集計ソフト』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く