タグ

関連タグで絞り込む (285)

タグの絞り込みを解除

データに関するsotukenyouのブックマーク (210)

  • Curve Fitting Toolbox

    Curve Fitting Toolbox には、データを曲線や曲面で近似するためのアプリや関数が用意されています。このツールボックスでは、探索的データ解析や、データの前処理/後処理、候補となるモデルの比較、異常値の排除などを実行できます。また、付属の線形モデルや非線形モデルのライブラリを使用するか、ユーザー独自のカスタム方程式を指定して、回帰解析を行うことができます。このライブラリには、近似の質を向上するために最適化されたソルバーパラメーターと開始条件が用意されています。またこのツールボックスでは、スプライン、内挿、平滑化などのノンパラメトリック モデリング手法も利用可能です。 近似を行った後には、プロット、内挿および外挿、信頼区間の推測、および積分と微分の計算のために、さまざまな後処理方法を適用できます。

    Curve Fitting Toolbox
  • データへの確率分布オブジェクトの近似 - MATLAB fitdist - MathWorks 日本

    pd = fitdist(x,distname,Name,Value) は、1 つ以上の名前と値のペア引数で指定された追加オプションを使用して、確率分布オブジェクトを作成します。たとえば、打ち切りデータを示すか、反復近似アルゴリズムの制御パラメーターを指定できます。 [pdca,gn,gl] = fitdist(x,distname,'By',groupvar) は、distname で指定された分布をグループ化変数 groupvar に基づいて x 内のデータに近似して、確率分布オブジェクトを作成します。近似確率分布オブジェクトの cell 配列 pdca、グループ ラベルの cell 配列 gn およびグループ化変数レベルの cell 配列 gl を返します。

  • http://shower.human.waseda.ac.jp/~m-kouki/pukiwiki_public/117.html

  • ガウシアンフィルタの特徴 画像処理ソリューション

    確かに処理結果を見てみると、ガウシアンフィルタが最も高周波成分を除去できているように 思います。 なぜ、そうなるのか? には数式においても、この効果が証明できるような事が書いてありましたが、ちょっと難しいので、 カーネルの値について見てみたいと思います。 そもそも、ある特定の周期の成分を消すためには、どうすれば良いか?というと、 周期の半分の離れた2点のデータを平均していけば、その周波数の成分を消す事が出来ます。 ここで、画像で表すことのできる最も高い周波数は 明  暗  明  暗  明  暗  明  暗  明  暗  明  暗  明  暗  明  暗 となる2画素周期のパターンで、このパターンを消すためには、隣り合う2画素の輝度値を 平均すると、画像データから最も高周波の成分を除去する事が出来ます。 しかし、隣り合う2画素の平均の結果は、画素間の位置の輝度値を示してしまうので、 この平

  • 2 次元および 3 次元プロット - MATLAB & Simulink - MathWorks 日本

    データを可視化するにはプロットを使用します。たとえば、データのセットを比較したり、時系列でデータの変更を追跡したり、データ分布を表示したりできます。プロットは、グラフィックス関数を使用してプログラムで作成するか、MATLAB® デスクトップの最上部にある [プロット] タブを使用して対話形式で作成します。 プログラムで作成可能ないくつかのプロットの図については、MATLAB プロットのタイプを参照してください。 カテゴリライン プロット ラインプロット、対数プロットおよび関数のプロット データ分布プロット ヒストグラム、円グラフ、ワード クラウド、その他 離散データ プロット 棒グラフ、散布図、その他 地理プロット データをマップ上に可視化 極座標プロット 極座標でのプロット 等高線図 2 次元および 3 次元等値線プロット ベクトル場 矢印、コンパス、フェザーおよびストリーム プロット

  • Excelの散布図でプロットした任意の2点を直線で結びたいのですが

    Excel2002での質問です。 X,Y座標系で数点の座標を散布図を使ってプロットしています。 このグラフの任意の2点を選んで引いた直線をグラフ上に表示したいのですが 方法がわかりません。 Excel使いのプロの方、よろしくお願いします。

    Excelの散布図でプロットした任意の2点を直線で結びたいのですが
  • データからワンランク上の規則性を見つけるために 「分散」と「標準偏差」をざっくり理解し、エクセル分析しよう

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    データからワンランク上の規則性を見つけるために 「分散」と「標準偏差」をざっくり理解し、エクセル分析しよう
  • 相関分析と単回帰分析の違い

    マーケティングリサーチの進め方、 マーケティングリサーチで活用する統計解析(多変量解析)を詳しく解説します 相関分析と単回帰分析は、どちらも「2つの変数の関連性を検討する」ことを目的とした分析です。しかし、分析過程やアウトプットについては、次のような特徴的な違いがあります。 ・変数の対象性 相関分析では、「影響を与える変数」「影響を与えられる変数」といった想定はなく、シンプルに2つの変数の共変関係を検討します。他方、単回帰分析では、明確に「影響を与える変数」「影響を与えられる変数」を想定しなければなりません。この変数を入れ替えると、当然ながらまったく異なったアウトプットが出力されます。 ・測定単位との連動性 相関分析では、測定単位に関わらず、出力される相関係数は必ず「-1~1」の間の値となります。他方、単回帰分析における回帰係数は、そもそも「説明変数の得点が1上昇すると、結果変数がどの程度

    相関分析と単回帰分析の違い
  • Q1

    Q1:相関と回帰の違いは何か?2つの変数の比例関係を見る点では相関も回帰分析も変わりないように思われるが…。 A1:2変数がどれくらい散らばっているかを表すのが相関[係数]である(図1a)。一方の変数から他方の変数を予測するために最も都合の良い直線を引くのが回帰[分析]である(図1b)。これらの目的は根的に異なり,Altman1)も両者を同時に求めることはあり得ないと述べている。従って,事前に「比例関係」とは何かを明確に定義づけて使い分けるのがポイントとなろう。 同一のデータであっても,相関係数と回帰係数が大きく異なることは意外に多い。1つの例を挙げよう。図2aは相関係数と回帰係数が,ともに1の直線関係にある例である。さて図2bは図2aと比べて回帰式が変化せず,相関係数のみが低くなった例である。回帰係数はyに対し,x方向からみて誤差が最小となるような直線を引くから1になるのである。もちろ

  • 京都光華女子大学・京都光華女子大学短期大学部

    〒615-0882 京都市右京区西京極葛野町38 Copyright © Kyoto Koka Women's University All Right Reserved.

  • 高速フーリエ変換でデータ数が2のべき乗でない時 - OKWAVE

    離散フーリエ変換は、信号が周期的であることを前提としています。 離散フーリエ変換でのデータ数Nは、離散時間信号の周期に当たります。変換の結果は線スペクトルとなります。 N=5000がその信号の1周期なのでしょうか。 もしそうならば、4096にすれば、誤差が大きくなるでしょう。 N=5000で変換すべきです。この場合にも高速アルゴリズムが 存在します。#1の方のとおりです。 FORTRANの時代には、パッケージがありました。 NはN=2^m*3^n*5^k*7^Lだったと思います。 もうひとつの考え方は、有限持続時間信号のフーリエ変換としての 適用です。これは、連続スペクトルとなります。データ数Nは スペクトルの分解能に関係します。サンプリング周波数をNで割った ものが周波数分解能となります。 実際のデータよりも2倍程度のNを使うことが多いと思います。 データ数が5000ならば、Nは8192

    高速フーリエ変換でデータ数が2のべき乗でない時 - OKWAVE
  • フーリエ変換のデータの補間について

    Excelでやると仰っているから、課題か何かでちょっと試している程度のことなのでしょう。でも、もし気でFFTを使うのであれば、どんな格好のデータを扱っていて[特に両端点はどうなっていて]、FFTをやったあと何をする積もりなのか、に大いに依ります。(なので、もし実務でお困りになってのご質問なら、もう少し詳細を補足して下さい。) でもま、大抵の応用では、255点のデータがあったら(256点に増やすどころか)最低でも512点にします。不足したところには0を詰めるの(zero-padding)が普通ですが、そうしない方が良い場合だって多々あります。(たとえば画像において、縁の方の画素が0から遠く離れた値であるなんて時には、安易に0を詰めちゃ駄目な応用が多いです。) FFTではデータが周期的であることが前提です。しかし、来周期なんかない255点のデータのフーリエ変換(従って厳密な意味ではFFTは

    フーリエ変換のデータの補間について
  • 自己相関を使用した残差解析 - MATLAB & Simulink - MathWorks 日本

    この例では、信頼区間をもつ自己相関を使用してノイズ データの最小二乗近似の残差を解析する方法を示します。残差は近似モデルとそのデータの誤差を示します。信号とホワイト ノイズのモデルで信号に対して良い近似が得られている場合は、残差はホワイト ノイズのはずです。 加法性ホワイト ガウス ノイズを伴う 1 次の多項式 (直線) で構成されるノイズ データ セットを作成します。加法性ノイズは N(0,1) 分布に従う一連の無相関確率変数です。これは、すべての確率変数は平均 0 と分散 1 をもつことを意味します。再現性のある結果を得るために、乱数発生器を既定の状態に設定します。

  • 産総研:ビッグデータから新たな科学的発見をもたらす統計手法を開発

    ビッグデータからの科学的発見のためには、正確な検定値(P値)の算出が必要。 超高速アルゴリズムを用いた新たな統計検定手法を開発し、発見力を大幅に改善した。 物理学、医学、化学など全ての実験科学において世界中での広い利用が期待される。 JST 課題達成型基礎研究の一環として、産業技術総合研究所 生命情報工学研究センターの津田 宏治 主任研究員(JST ERATO「湊離散構造処理系プロジェクト」グループリーダー)、東京工業大学 大学院情報理工学研究科 計算工学専攻の瀬々 潤 准教授、理化学研究所 統合生命医科学研究センターの岡田 眞里子 チームリーダーらは、従来に比べて格段に高い精度で誤発見の確率を示す検定値(P値)を計算するアルゴリズム(手順)を開発しました。 自然科学で得られるデータ量は増加の一途をたどり、これらを有効に解析できる方法が望まれています。しかし、従来の統計検定手法は観測できる

  • 重回帰分析

    Excel:重回帰分析(3)・・・分析ツールの使い方,説明変数の選び方 ここでは,学的に厳密なことは望まず,仕事や研究で報告書を半日程度でまとめなければならない人を念頭に置いて,大筋の説明を目指す.重回帰分析自体に使える時間として,は30分~1時間程度を想定する.(もっと詳しい説明が必要な人は下端に参考資料を示す.) ■Excelの分析ツールの使い方■ 次の例では,冷蔵庫の「実勢価格」(目的変数)を「総容量L」「ドア数(個)」「冷蔵室L」「冷凍室L」「野菜室L」「製氷室L」(説明変数)で表わす重回帰式を求めることを当面の目標とする. 次の図のように目的変数(被説明変数,従属変数)がA列にあり,説明変数(独立変数)がB~G列に入力されている場合を例に解説する. 操作方法は、下の[前の操作][次の操作]ボタンを順次押せば表示される.(データの出所:2007.3.18に価格.com>スペック検

  • 生態学データ解析 - 最尤推定法とは

    最尤推定 (さいゆうすいてい): 「最ももっともらしい」パラメーターの推定 「尤」の音読みは「ゆう」,訓読みは「もっともらしい (尤もらしい)」です. 尤度とは,ある確率論的モデルを仮定しているときに,その観測データが得られる確率 (あるいは確率密度) 簡単には,ある観測データに (あるパラメーターのもとで) 確率論的モデルが「どれぐらいあてはまっているか」を確率で表す尺度です 最尤推定とは,尤度を「手持ちの観測データのもとで,あるパラメーター値が得られる確率」とみなして (つまり尤度が未知パラメーターの関数とみなして),尤度を最大化するようなパラメーター値を探索する推定方法です 最尤推定法を使う手順は 尤度方程式を作る: 確率論的モデルを作り (データがどういう確率分布に従うか,確率分布のパラメーターの関数型はどうなってるか),それを数式として定義する……これが尤度方程式である 尤度最大

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • MapReduce - Wikipedia

    MapReduce(マップリデュース)は、コンピュータ機器のクラスター上での巨大なデータセットに対する分散コンピューティングを支援する目的で、Googleによって2004年に導入されたプログラミングモデルである。 このフレームワークは関数型言語でよく使われるMap関数とReduce関数からヒントを得て作られているが、フレームワークにおけるそれらの用いられ方は元々のものと同じではない。 MapReduceのライブラリ群は、C++、C#、Erlang、Java、OCaml、PerlPythonPHPRuby、F#、R言語、MATLAB等のプログラミング言語で実装されている。 MapReduceは巨大なデータセットを持つ高度に並列可能な問題に対して、多数のコンピュータ(ノード)の集合であるクラスター(各ノードが同じハードウェア構成を持つ場合)もしくはグリッド(各ノードが違うハードウェア構成

  • 非構造化データ - Wikipedia

    この記事には複数の問題があります。改善やノートページでの議論にご協力ください。 出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。(2012年2月) 独自研究が含まれているおそれがあります。(2012年2月) 出典検索?: "非構造化データ" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL 非構造化データ (ひこうぞうかデータ、Unstructured Data) とは、構造定義されておらず、主に関係モデルにうまく適合しないデータモデルに分類されるデータを指す。 データの変遷[編集] 従来より、人は商業活動や自然現象などを記録/測定した数値を、意味のあるデータ(情報)として活用してきた。そのような数値データを、より効率的に、より生産的に活用するために、計算機(コンピュータ)

  • ビッグデータ時代に熱望される3つのスキル|【Tech総研】

    今年になって「ビッグデータ」という言葉がクローズアップされるようになった。今後、大量なデータを保管するだけではなく、効率的な分散処理、そして分析によってビジネスにどう活用していくかが重要視されている。格的なビッグデータ時代を迎える今、必要とされるエンジニアについて探ってみたい。 ビッグデータとはその名の通り、大量のデータを指す。その定義は人により異なるが、一般的には数百テラバイトからペタバイト級以上のデータを指すことが多い。 しかし最近になってなぜ、「ビッグデータ」というキーワードが注目を集めるようになったのか?その理由について、ビッグデータ関連の記事を寄稿するなど、ビッグデータ事情に詳しい栗原氏によると、「ビジネスパーソンの注目が集まった」ことだという。 「大容量データをどう効率的に処理・保管するか、というビッグデータ類似のコンセプト自体は10年以上前からありました。しかし、データ管理