This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.
RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です核関数を用いた平滑化 Nadaraya-Watson による核関数を用いた回帰平滑化を行う。 ksmooth(x, y, kernel = c("box", "normal"), bandwidth = 0.5, range.x = range(x), n.points = max(100, length(x)), x.points) ↑ 散布図平滑化 LOWESS 平滑化による計算を実行する。 lowess89 は平滑結果の座標である x と y を成分に持つリストを 返す。平滑結果は lines() 関数で元の散布図プロットに描き加えることができる。 lowess(x, y = NULL, f = 2/3, iter=3, delta = 0.01 * diff(range(xy$x[o
RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですR の回帰分析と分散分析関数の簡易一覧 Rは回帰分析関連の関数を多数持ち、統計解析機能の中心的位置を占める。 以下では、線形(重)回帰モデル、一般化線形モデル、非線型回帰モデル、そしていくつかの 現代的手法用の関数を紹介する。現代的な統計理論では、分散分析も線形回帰モデルとして処理することが 普通であるため、分散分析関連の関数もここで一緒に紹介するのが適当である。 線形モデルを当てはめる lm() 関数 lm() は線形モデルの当てはめに使われる。回帰分析、および一元配置 分散・共分散分析を行える(後者に付いては aov() 関数の方がより広範囲なインタフェイスを与える)。 lm(formula, data, subset, weights, na.action, method = "qr"
Popular statistical tables, country (area) and regional profiles Population Population, surface area and density PDF | CSV Updated: 25-Oct-2023 International migrants and refugees PDF | CSV Updated: 25-Oct-2023 Population growth, fertility, life expectancy and mortality PDF | CSV Updated: 25-Oct-2023 Population in the capital city, urban and rural areas PDF | CSV National accounts GDP and GD
Technical Data presentation in R コピペで学ぶ Rでテクニカルデータプレゼンテーション 1.基礎統計解析編 グラフィックス・リテラシ-教育: 「図学 I ・図形情報 I ・統計学」科目 修了後のコースウェア 福岡大学工学部図学教室 梶山 喜一郎 ・つまみ食いで,学習しないように願います. ・データの可視化を体系・系統だったスキルにするために順を追って学習する. ・統計ブームに乗っている学習者も先人に感謝の気持ちを.さらに, ・確かなスキルにするために,教科書・解説書を理解し,Rスクリプトで確認. A. はじめに--ここは統計・解析の必要を味わった後で読めばよい まず,統計の手続きを実行する.慣れたら統計的に考えよう. 学校の統計学を復習--買った教科書とノートをまた読むだけ a. 測定と尺度 Measurement and scale b. 記述統計学の
はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、
Rはループ速度が段違いに遅いと言われる。確かにループとメソッド呼び出しで構成したマイクロベンチマークを実行すると、Javaが6.32秒、C++で6.33秒で終わる処理が、87時間18分16.0秒(推定値)かかったりする。S-PLUSやMatlabなどの他の同種の言語よりは高速か同等と指摘されているが、汎用言語に比べると断然遅い(Benchmark 2)。 もちろん大半の計算は問題ない。標本数1万ぐらいのサンプルでプロビット分析を行っても、1秒もかからず計算が終わる。コマンドを打っている時間の方が圧倒的に長い。しかし人間はどのような環境でも速度に憧れるものだ。そしてRでも短時間に処理を終わらせる為のコツはある。 1. パッケージや内部関数を使う 大抵の著名パッケージはC言語で実装されているので、内部的な処理は高速だ。Rではなるべくコードを書かない方が良い。スクリプト言語やインタープリッタ全般
米国FDAで公認され、ハーバード大学やイェール大学の授業で利用されるようになり、世間での認知度が着実に上昇している統計用プログラミング環境のRだが、ユーザーなのか、ユーザーになりたいのか、ユーザーとして振舞いたいのか分からない人が増えてきた。 スノッブなユーザーとして振舞う場合は、Rの特性を語れる必要があるので、ユーザーになるよりもRへの知識や理解が必要で、実は難易度が高い行動である。それでもあえて意識の高いRユーザーとして振舞いたい人々のために、最低限求められる事のチェック・リストを用意してみた。 1. 参考文献や参考ページを押さえておく 一番大事な事だが、参考文献や参考ページを押さえておこう。公式サイトで配布されている、「R 入門」「R 言語定義」「R のデータ取り込み/出力」は持っておくべきだ。R-TipsやRjpWikiも参考になる。 2. 演算子や制御構文をマスターする 四則演算
最近個人的にやっと R のブームが来ています。2009 年に Tsukuba.R に参加して gfx さんの前で Perl の話をするという謎のイベントをこなして以来、「そろそろ R 使うか」と言い続けてはや 2 年。ついに遅れたマイブームがやってきました。 さて、今回やってみたのは前回入れてみたサーバ版の RStudio を使って、Apache のアクセスログを何らかグラフにしてみたという内容になります。凝ったことしようとしたんですが、そもそも R がよく分からなかったのでとりあえずできた最低限の話と、いくつか BK 的なものを。間違ってたら教えてくだしあ>< 今回の目標=アクセスログの 1 時間毎のヒストグラムをグラフにする とりあえずということで、こういうグラフを作ることを目標にしましょう。数値だけであれば以前紹介したコマンドラインで十分でこんな感じ。 参考:突然の Twitter
平均は同じであるが標準偏差が大きく異なるデータのヒストグラムの例。赤で示されたデータの方が青で示されたデータよりも標準偏差が小さい。 平均 0, 標準偏差 σ の正規分布の確率密度関数。この分布に従う確率変数が 0 ± σ の間に値をとる確率はおよそ 68% であることが読み取れる。 標準偏差(ひょうじゅんへんさ、(英: standard deviation, SD)とは、データや確率変数の、平均値からの散らばり具合(ばらつき)を表す指標の一つである。偏差ベクトルと、値が標準偏差のみであるベクトルは、ユークリッドノルムが等しくなる。 標準偏差を2乗したのが分散であり、従って、標準偏差は分散の非負の平方根である[1]。標準偏差が 0 であることは、データの値が全て等しいことと同値である。 母集団や確率変数の標準偏差を σ で、標本の標準偏差を s で表すことがある。 二乗平均平方根 (RMS
Kami tahu bahwa slot online menarik, menyenangkan, dan dapat meningkatkan peluang Anda untuk memenangkan banyak uang. Tetapi dengan begitu banyak pilihan di luar sana, bagaimana Anda tahu mana yang harus dipilih? Jika Anda ingin mencapai kesuksesan di industri judi slot, Situs Judi Slot Terbaik dan Terpercaya Nomor 1 di Indonesia adalah pilihan terbaik Anda. Situs ini telah memperoleh reputasi yan
「R(またはR言語とも呼ぶ)」は、オープンソースの統計解析向けのプログラミング言語とその開発実行環境である。現在はR Development Core Teamによって開発およびメンテナンスが進められており、GPLにもとづいて無料で利用することができる。LinuxやFreeBSDをはじめとするUNIX系OSやMac OS、Windowsなど、複数のOSでの開発・実行に対応している。 Rは利用目的を統計解析に特化した言語であり、データを効率的に操作・保管するための仕組みや、配列や行列の演算をサポートした演算子のセット、結果を可視化するためのグラフ作成機能などを備えている。プログラミング言語としては条件分岐やループ処理、ユーザー定義の再帰的関数、テキスト形式のデータ入出力などといった基本的な機能を備えているほか、オブジェクト指向の手法も取り入れている。 最大の強みは、多くの標準的な統計手法を標
交差検定(英: Cross-validation)とは、統計学において標本データを分割し、その一部をまず解析して、残る部分を最初の解析の仮説検定に用いる手法[1] [2] [3]。 最初に解析するデータを「訓練事例(training set)」などと呼び、他のデータを「テスト事例(testing sets)」などと呼ぶ。 交差検定は Seymour Geisser が生み出した。特にそれ以上標本を集めるのが困難(危険だったり、コストがかかったり)な場合、データが示唆する仮説を検証することに慎重になる必要がある。 [編集] 交差検定の主な種類 [編集] ホールドアウト検定 一般にホールドアウト検定は交差検定には分類されない。なぜなら、データを交差させることがないためである。初期標本群から事例を無作為に選択してテスト事例を形成し、残る事例を訓練事例とする。テスト事例に使われるのは初期の標本群の
最尤推定(さいゆうすいてい、英: maximum likelihood estimationという)や最尤法(さいゆうほう、英: method of maximum likelihood)とは、統計学において、与えられたデータからそれが従う確率分布の母数を点推定する方法である。 この方法はロナルド・フィッシャーが1912年から1922年にかけて開発した。 観測されたデータからそれを生んだ母集団を説明しようとする際に広く用いられる。生物学では塩基やアミノ酸配列のような分子データの置換に関する確率モデルに基づいて系統樹を作成する際に、一番尤もらしくデータを説明する樹形を選択するための有力な方法としても利用される。機械学習ではニューラルネットワーク(特に生成モデル)を学習する際に最尤推定(負の対数尤度最小化として定式化)が用いられる。 最尤推定が解く基本的な問題は「パラメータ が不明な確率分布に
実践としての統計学 作者: 佐伯胖,松原望出版社/メーカー: 東京大学出版会発売日: 2000/01メディア: 単行本購入: 48人 クリック: 629回この商品を含むブログ (16件) を見る 第5章「統計の実践的意味を考える」(佐藤俊樹) 研究会に向けて、同じ社会学者が書いた統計分析についてのエッセイということで読んでみた。頭を整理する意味で、サマリを作ってみた。 5.1 統計解析の「意味」 SPSSなどのソフトウェアの普及のせいで、意味もわからず「ハウツー」で統計分析をする人が増えて、統計学的に間違った分析が横行している。(例:全数調査でカイ二乗検定。) なぜ「ハウ・ツー」ユーザが増えたのか。それは統計パッケージソフトが普及して、統計学の知識がなくても結果だけは出せるようになったからである。(以前はそれができなかったので、結果を出す人は手順の意味を理解していた。) いくら統計パッケー
マイクロソフト社が技術分野でもっと熱い専攻の一つとして分析/統計をあげている(Microsoft JobsBlog)。同社以外でも統計学は、今後最も有益なスキルの一つだと考えているようだ(NYT - For Today’s Graduate, Just One Word: Statistics)。しかし、データマイニングの話も一般化しつつあって学習ノウハウなども公開されているが、経験にあわない部分が多い。統計学を初めて勉強するときに知っておいた方が良い7つのポイントをあげてみた。 1. 学習機会やテキストは山のようにあるので利用する 確率・統計の日本語テキストは山のようにあり、大学のコースワークを振り返っても、理文問わずにほとんどの学部で確率・統計はあったはずだ。大学院のコースワークでは英語の文献を好む傾向があるが、上級テキストでも日本語のものも少なくない。また「マンガでわかる統計学」のよ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く