statisticsとrに関するtsutatsutatsutaのブックマーク (14)

  • biunit

  • 三次元散布図をRで描くのに画期的な新機能がRGLパッケージに加わった - ほくそ笑む

    以前、三次元散布図をRで描いてみたという記事で紹介したRGLパッケージに画期的な新機能が加わったので紹介します。 (情報源:R: Interactive 3D WebGL plot of time-space cube with RGL | geolabs) RGLパッケージの良いところは、3次元プロットをマウスドラッグでグリグリ動かせるところなのですが、いざ、ファイル出力しようとすると、静止画か動画でしか保存できず、インタラクティブな3次元プロットをそのままファイルに保存することができないというのが欠点でした。 しかし今回、新機能として、WebGL で動く HTML ファイルとして保存できる機能が付加されたようです。 さっそく試してみましょう。 install.packages("rgl") library("rgl") data(trees) plot3d(trees) writeWe

    三次元散布図をRで描くのに画期的な新機能がRGLパッケージに加わった - ほくそ笑む
  • 「子供に解けて大人に解けない問題」を統計的に無理やり解いてみた - ほくそ笑む

    今日は、R-bloggers に面白い記事が上がっていたので、それを紹介してみようと思います。 問題 「子供にはすぐに解けて、大人にはなかなか解けない不思議な問題」をご存知でしょうか? 最近ネットで割と話題になりました。 その問題は、次のようなものです。 8809 = 6 7111 = 0 2172 = 0 6666 = 4 1111 = 0 3213 = 0 7662 = 2 9312 = 1 0000 = 4 2222 = 0 3333 = 0 5555 = 0 8193 = 3 8096 = 5 7777 = 0 9999 = 4 7756 = 1 6855 = 3 9881 = 5 5531 = 0 2581 = ? https://twitter.com/#!/yappyJP/statuses/172086299099004928 なかなか面白い問題です。 答えはここでは書きませ

    「子供に解けて大人に解けない問題」を統計的に無理やり解いてみた - ほくそ笑む
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 主座標分析について簡単に紹介するよ! - ほくそ笑む

    今日は主座標分析(Principal Coordinate Analysis; PCoA)の紹介を簡単にしたいと思います。 主座標分析は古典的多次元尺度構成法(Classical Multidimensional Scaling; CMDS)とも呼ばれる統計解析手法です。 この解析手法を使用する主な目的は、高次元のデータを2次元や3次元に落として視覚化したいという時に使います。 以前紹介した主成分分析と同じような感じですね。*1 主成分分析との違いを簡単に言うと、主成分分析はユークリッド距離をなるべく保ちながら低次元に落とす方法ですが、主座標分析はユークリッド距離だけでなく、他の距離や類似度*2が使えるという点にあります。 例えば、ユークリッド距離の代わりに相関係数を使えば、相関の高いもの同士が近い配置になるようなプロットを作ることが可能です。 データを用意する さっそくやってみたいのです

    主座標分析について簡単に紹介するよ! - ほくそ笑む
  • Using Text Mining to Find Out What @RDataMining Tweets are About

    This post shows an example on text mining of Twitter data with R packages twitteR, tm and wordcloud. Package twitteR provides access to Twitter data, tm provides functions for text mining, and wordcloud visualizes the result with a word cloud. If you have no access to Twitter, the tweets data can be downloaded as file “rdmTweets.RData” at  http://www.rdatamining.com/data, and then you can skip the

    Using Text Mining to Find Out What @RDataMining Tweets are About
  • spider: SPecies IDentity and Evolution in R

    Spider: SPecies IDentity and Evolution in R, is a new R package implementing a number of useful analyses for DNA barcoding studies and associated research into species delimitation and speciation. Included are functions essential for generating important summary statistics from DNA barcode data, assessing specimen identification efficacy, and for testing and optimising divergence threshold limits.

  • R AnalyticFlow

    R AnalyticFlow ウェブサイトに移動します。 自動的に移動しない場合は リンクをクリックするか、ブラウザのアドレスバーに 直接 "r.analyticflow.com/ja/" と入力してください。

    tsutatsutatsuta
    tsutatsutatsuta 2011/11/26
    フローチャートを描いてデータ分析
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

  • 租界〈R〉の門前にて

    ◇宣伝!— 三中信宏『みなか先生といっしょに 統計学の王国を歩いてみよう:情報の海と推論の山を越える翼をアナタに!』 2015年6月5日刊行,羊土社,東京,191 pp., 体価格2,300円, ISBN:978-4-7581-2058-6 → 目次|版元ページ|コンパニオンサイト ◇連載〈統計の落とし穴と蜘蛛の糸〉 羊土社から発行されている雑誌『実験医学』2014年2月号から隔月連載された〈統計の落とし穴と蜘蛛の糸〉記事のオンライン版です. → オンライン連載トップページ 第1回 データ解析の第一歩は計算ではない(2014年2月号, pp. 442-447) 第2回 データの位置とばらつきを可視化しよう(2014年4月号, pp. 935-940) 第3回 データのふるまいをモデル化する(2014年6月号, pp. 1427-1433) 第4回 パラメトリック統計学への登り道〔1〕:ば

  • First draft on R Coding Conventions

    - a first draft Version 0.8, February 2005 Henrik Bengtsson Division for Mathematical Statistics, Centre for Mathematical Sciences, Lund University, Sweden. Email: hb@maths.lth.se Adapted with kind permission from Java Programming Style Guidelines v3.0 by Geotechnical Software Services http://geosoft.no/javastyle.html. Please note that these guidelines are ours and not the R-develop

  • Google's R Style Guide

    R is a high-level programming language used primarily for statistical computing and graphics. The goal of the R Programming Style Guide is to make our R code easier to read, share, and verify. The rules below were designed in collaboration with the entire R user community at Google. Summary: R Style Rules File Names: end in .R Identifiers: variable.name, FunctionName, kConstantName Line Length: ma

  • 子どもの読書に関するアンケートの実施について(姫路市立図書館ホームページ)

    市内小中学校20校に対し、小学校4年~6年、中学校1~3年の児童生徒を対象に、子どもの読書に関するアンケートの実施しました。このページはその集計と分析について報告いたします。 なお、アンケートに協力していただいた児童生徒のみなさん、実施協力くださいました小中学校の教諭の皆様にお礼申し上げます。 1 . 調査目的 近年、図書館など子どもの読書環境は、充分とは言えませんが整えられつつあります。また、読書の意義についての社会認識の高まりから、幼い頃からの絵などの読み聞かせを実施している家庭も多くなっています。しかし、一方で、2005年のOECDの学習到達度調査におけるPISAショック、子どもの活字離れ、公立図書館の児童貸出冊数の低下、学校読書調査における不読者層の増加など、子どもの読書を憂う状況が報告されています。 年度、子ども読書活動推進計画(第二次)を策定するにあたり、図書館では子ど

    tsutatsutatsuta
    tsutatsutatsuta 2011/09/18
    "使用した統計ソフトは、R 2.10"
  • Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~

    Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。 ・姫路市役所での事例 これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。 ※まだ不完全ですが情報を入手し次第アップデートしていきます。 1. 資料を探す場所 CRAN R体、パッケージ、PDF資料などの置き場 Task Viewに分野ごとのまとめ Searchでパッケージや資料の検索 CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw) Rjpwiki 日語で書かれている、これまでのRに関する資料の集大成 データの加工技、

    Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~
  • 1