タグ

統計に関するonyx-pigのブックマーク (19)

  • 散布図の作成と相関係数の計算(相関分析) with Excel

    イントロダクション 相関分析のツール,散布図・相関係数を描画・計算します。変数どうし,互いの関係をビジュアルに表現するのが散布図で,定量的に表現するのが相関係数です。 相関係数($r$)は$-1$から$1$の範囲の値をとります。このとき,$-1\leqq r<0$の範囲を負の相関,$r=0$のものを無相関,$0<r\leqq 1$の範囲を正の相関と呼びます。 相関は,$r$が負であれば$-1$,正であれば $1$ に近づくほど強く,反対に $0$ に近づくほど弱いと判断します。このような相関の強弱について,相関分析に触れた書籍などでは,概して数段の階層的判断基準が併載されているのを見かけます。そういった絶対的な基準は目安としてユーザーの判断をたすけてくれますが,そもそも相関係数が順序尺度である以上,ユーザーの経験に照らして比較するなど時として相対的な見方をもって判断を補うことが望まれる場面

  • 統計(METI/経済産業省)

    6月10日特定サービス産業動態統計速報(4月分) 5月31日石油統計速報(4月分) 5月31日第53回 令和5年(2023年)調査 海外事業活動基調査 確報 5月31日商業動態統計速報(4月分) 5月31日鉱工業生産・出荷・在庫指数速報(4月分) 5月31日製造工業生産予測指数(5月調査) 5月31日鉱工業出荷内訳表・総供給表(4月分) 5月31日経済産業省生産動態統計速報(4月分) 5月21日特定サービス産業動態統計確報(3月分) 5月20日第3次産業活動指数(3月分) 5月17日経済産業省生産動態統計時系列表(61ヶ月) 5月16日商業動態統計確報(3月分) 5月16日製造工業生産能力・稼働率指数(3月分) 5月16日経済産業省生産動態統計確報(3月分) 5月16日石油統計月報(3月分) 3月27日「2023年経済構造実態調査」一次集計結果 産業横断調査(企業等に関する集計) 3月2

  • 時系列データ - ビジネスデータ分析研究室

  • 第11回、移動平均線 その7、『 指数平滑移動平均線の重要性 』 - みんかぶ(先物)

    第11回『小次郎講師の使える テクニカル分析講座、実践編』 □さて、日は移動平均線の最終回。加重移動平均線、指数平滑移動平均線の説明に移る。 一般のサイトには移動平均線の種類として簡単に説明しているだけだが、実は加重移動平均線、指数平滑移動平均線はテクニシャン達の夢への一里塚なのだ。 □テクニシャンを目指すなら、ここは極めなければならない。 ということで、移動平均線の最終回記念ということもあり、日もまたまた特別拡大バージョンでお送りする。 ■助手のムサシです。よろしくお願いします。 当は書いているうちにあれも書きたいこれも入れたいとどんどんページ数が増えて、・・・気がついたらこんなページ数になったというのが事実だったりします(笑)。 □余計なことは言わなくていい。 【移動平均線の略称】 単純移動平均線=Simple Moving Average=SMA 加重移動平均線=Weighte

    第11回、移動平均線 その7、『 指数平滑移動平均線の重要性 』 - みんかぶ(先物)
  • 過去の数値から将来の数値を予測するには - FORECASTの解説 - エクセル関数リファレンス

    FORECASTの解説 過去の数値から将来の数値を予測する方法 FORECAST関数を使用すると、過去の数値から将来の数値を予測することができます。FORECAST関数の使用例としては、各年の売上金額から将来の売上金額を予測する場合などが挙げられます。各年の売上金額の推移は、x軸に時間、y軸に売上金額を指定して棒グラフや折れ線グラフなどのグラフで表す場合があります。 =FORECAST(x,既知のy,既知のx) 「x」・・・予測するx軸の値を指定します。 「既知のy」・・・将来の数値を予測するための元になる数値のセルの範囲を指定します。 「既知のx」・・・将来の数値を予測するための元になる年や日などのセルの範囲を指定します。既知のxのセルは数値でなければなりません。 入力例 「x」、「既知のy」、「既知のx」を指定します。2013年度の予測をするには、xには2013を指定します。 =FOR

  • 最近隣法による単純予測 with Excel

    イントロダクション 「ナイーブ(naïve)な予測」とは,次の1期の定量的な予測値を用意する必要に迫られたとき,直前の実測値をそのままスライドさせて“予測値”に充てる方法を指します。ここで扱う方法はその単純さを踏襲しつつも,「そのまま」ではなく再近隣法による合成値を使います。 念のため,ここにいう「ナイーブ」は,英語圏でいうネガティブなニュアンスを保持したものです。予測という行動にシャープな論理性を同伴させる目的では薄弱ですが,裏を返せば理解しやすいシンプルなしくみであることから,「予測」といったものを何らの手段で出さなければならないときに,ユーザーが他にノウハウを所持していなければ,取っ掛かりの容易さという意味では最も利用しやすい部類の方法と言えます。 最近隣法で特徴的といえるのは,ある“パターン”を探すことです。これを予測に準用するとき、直近にあらわれたパターンを過去のデータの蓄積に照

  • 移動平均法による季節調整 with Excel

    Step 0シチュエーションの設定 2007年1月から2012年9月の6年弱にわたる月次の軽自動車販売台数のデータです。感覚的に,これは季節性や無作為性を強く含むであろうデータのように思われます。このデータを用いて,移動平均による季節調整をおこない,トレンドを確認します。 [データの出所: 日自動車販売協会連合会ウェブサイト ―url: http://www.jada.or.jp/contents/data/index09.html; リンク切れ]

  • 指数平滑法による単純予測 with Excel

    イントロダクション 「ナイーブ(naïve)な予測」とは,次の1期の定量的な予測値を用意する必要に迫られたとき,直前の実測値をそのままスライドさせて“予測値”に充てる方法を指します。ここで扱う方法はその単純さを踏襲しつつも,「そのまま」ではなく指数平滑移動平均を使います。 念のため,ここにいう「ナイーブ」は,英語圏でいうネガティブなニュアンスを保持したものです。予測という行動にシャープな論理性を同伴させる目的では薄弱ですが,裏を返せば取っ掛かり易いシンプルなルールであるので,ユーザーが他にノウハウを所持していなければ,もっとも利用しやすい部類の方法と言えます。 ただ,ナイーブなアプローチをとるにしろ,いかんせんここで扱う売上のようなデータは,変動要素(スパンによっては季節変動, あるいは無作為な変動)を含むのが常であって,ときに許容しがたい誤差を抱えることがあります。単純な方法をとる以上「

  • (後編)今回は因果関係があるのに相関関係が見られない4つのケースについてまとめてみた:中間変量の影響 - Take a Risk:林岳彦の研究メモ

    どもっす。林岳彦です。先日、某所で統計解析の講師役をしました。その際に解析環境の準備の手間を省こうと思って、Amazon EC2上にRStudioのサーバー版を立てて、聴講者にそこに繋いでもらって実習をしようとしたのですが、いざ皆が繋いだらサーバーがクラッシュしまくって実習が全く進みませんでした*1 。。。すみませんでした(泣)*2。。 さて。 良かれと思ったもので逆に墓穴を掘る、というのは人生ではよくあることですよね! 前回の「合流点の追加によるバイアス」はそんな例の一つでしたが、今回の「後編」ではそのようなもう一つの例として、「中間変量の追加によるマスク」のケースについて見ていきます。 因果関係があるのに相関が見られないケース(4):中間変量によってマスクされている はい。では、中間変量によって因果効果がマスクされてしまうケースを見ていきます。 ここで「中間変量」というのは、「A→Z」

    (後編)今回は因果関係があるのに相関関係が見られない4つのケースについてまとめてみた:中間変量の影響 - Take a Risk:林岳彦の研究メモ
  • 今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ

    (※※※続編記事書きました→「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ) 今ちょうどadtech tokyo 2013の会期中で、職場からも近い&会社から行ってこいという指示が出たということで僕も色々セッションを聞いたり企業ブースのお話を聞いたりしてる*1ところです。 ところで、いくつかのセッションの中でキーワードとして「重回帰分析」という言葉が出てきてました。ま、それ自体はこのブログでもRによるデータ分析絡みで頻出だし、ぶっちゃけありふれた手法と言って良いでしょう。やりようによっては普通にExcelでもできますし、それだけ人口に膾炙していると言って良いのかもですね。 ただし。意外にも内部のパラメータというか細かい手法の分岐というか、それこそ普通の線形モデルvs.一般化線形モデル(バリエーション多数)があることを無視して漫然と重回帰分析をや

    今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ
  • Rで計量時系列分析:状態変化を伴うモデル(閾値モデル、平滑推移モデル、マルコフ転換モデル) - 渋谷駅前で働くデータサイエンティストのブログ

    前回の記事までは多変量時系列モデルとしてのVARモデルを扱ってきました。今回は一旦このシリーズの最終回ということで、元の単変量時系列モデルに戻って「状態変化を伴うモデル」を扱ってみようと思います。 ということでもはや毎回恒例になってますが、使用テキストはいつもの沖です。 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 作者: 沖竜義出版社/メーカー: 朝倉書店発売日: 2010/02/01メディア: 単行購入: 4人 クリック: 101回この商品を含むブログ (6件) を見る ただし今回の最後に出てくるマルコフ転換モデルは沖の説明では不足と思われるので、Hamiltonもあった方が良いです。 Time Series Analysis 作者: James D. Hamilton出版社/メーカー: Princeton Univ Pr発売日: 1994/01/11メ

    Rで計量時系列分析:状態変化を伴うモデル(閾値モデル、平滑推移モデル、マルコフ転換モデル) - 渋谷駅前で働くデータサイエンティストのブログ
  • http://nlftp.mlit.go.jp/ksj/jpgis/datalist/KsjTmplt-S05-c.html

  • 駅情報(乗降人員)|東武鉄道公式サイト

    東武鉄道の企業情報をご案内します。社是・信条、中期経営計画、会社の沿革などの企業情報から、鉄道事業、開発事業、交通公告、光ファイバケーブル事業、ニュースリリースなど各種情報をご覧いただけます。

    駅情報(乗降人員)|東武鉄道公式サイト
  • JR東日本:乗車人員ベスト100

    JR東日エリア内の1日平均の乗車人員を把握できる駅を掲載しています。駅名をクリックするとその駅の情報を見ることができます。 (乗車人員には、乗車の人員のみで、降車の人員等は含まれておりません。) ※東日大震災の影響により運転を見合わせていた区間の駅については、掲載していない期間がございます。

  • 【保存版】企画書に使いたい統計データが見つかる、調査レポートサイト厳選9個+α | Find Job ! Startup

    企画書には、市場規模・ユーザーニーズの裏付け等を説明するために調査データは入れたいところ。 ただ、資料作成で焦っている時ほど、検索しても良い情報が見つかりませんよね。そんな時は、今回ご紹介するサイトの中を覗いてみて下さい。スタートアップが投資家の方など社外向けに資料を作る時に、必ずや役に立つデータが見つかるはずです。 目次 【1】政府機関でデータを公開しているサイト(×2サイト) 【2】リサーチ会社の公開調査を横断的に探せるサイト(×3サイト) 【3】公開調査を見れる調査機関のサイト(×4サイト) 【4】自主調査の結果を公開しているリサーチ会社のサイト(+α) 【1】政府機関でデータを公開しているサイト 1.総務省統計局 総務省統計局のサイトでは、「国勢調査」「人口推計」から、「家計消費状況調査」「サービス産業動向調査」など様々な国内統計データが無料で閲覧できます。統計データ一覧はこち

  • データを取り込む・格納するための方法を理解する

    データを取り込む・格納するための方法を理解する:ITエンジニアのためのデータサイエンティスト養成講座(3)(1/4 ページ) データ分析を行う際の対象となるデータにはさまざまな形式が存在します。データ分析を行うには、まず、データを取り込む方法や、結果セットを書き出したり、データベースに格納したりする手続きが必要です。今回はデータの取得、格納といった分析のための下処理の手続きを紹介します。 連載バックナンバー 前回(連載第2回)は、データ分析に必要な機能と、その機能を実装したPython環境や必要なライブラリのセットアップ方法を説明しました。今回は、分析に必要なデータを、CSV(カンマ区切り)形式のファイルやリレーショナルデータベース、Webサイトなどから取り込む方法について解説します。さらに、結果セットをCSV形式で書き出したり、リレーショナルデータベースに格納する方法も紹介します。 デ

    データを取り込む・格納するための方法を理解する
  • Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ

    追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ

    Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
  • 総務省|報道資料|統計データにおけるAPI機能の試行運用開始

    総務省は、統計データの高度利用環境の構築のため、平成25年6月10日(月)午前10時から、統計データにおけるAPI機能の導入による試行運用を開始します。これは、オープンデータ推進のトップランナーとして政府の取組を先導するものです。 総務省統計局は、平成25年5月28日付け報道資料(参考1)のとおり、統計におけるオープンデータの高度化を進めることとしており、今般、このうちAPI機能の導入について、独立行政法人統計センターが運用する「次世代統計利用システム」上で、6月10日午前10時から試行運用を開始することになりました。 API機能の導入により、例えば、(1)利用者の情報システムに政府統計のポータルサイト(e-Stat)のデータを自動的に反映、(2)ユーザー保有やインターネット上のデータ等と連動させた高度な統計データ分析などが可能となります。これにより、ビジネス活性化や新規事業の開発促進、行

    総務省|報道資料|統計データにおけるAPI機能の試行運用開始
  • 気象庁|過去の気象データ・ダウンロード

    推奨ブラウザ : Microsoft Edge(最新版), Mozilla Firefox(最新版), Google Chrome(最新版) ご利用にあたっての注意事項 一回にリクエストできるデータ量には上限があります(コンテンツ右上棒グラフ参照)。 アクセス集中時や一回のデータ量が多い場合、繋がらないことやデータ取得に時間がかかることがあります。繋がらない場合は時間をおいて再度お試しください。 アクセス集中の原因となりますので、自動化ツール等による過度のアクセスはお控えいただくようお願いいたします。 新着情報 気象官署の移転及び風向風速計の移設に伴い、平年値の一部を更新しました。詳細は「2020年平年値の更新について」(PDF形式:381KB)をご覧ください。(2023.5.17) 更新履歴 データ修正のお知らせ 「四日市」(三重県)において、観測環境が悪化していたため、2016年10月

  • 1