統計分析ソフトウェア R のための検索エンジンです。R 言語に関する内容に特化した検索結果を表示します。
統計分析ソフトウェア R のための検索エンジンです。R 言語に関する内容に特化した検索結果を表示します。
ひさしぶりに統計ソフトRの話。 来年こそは仕事でバリバリつかってみようと思っている統計ソフトのR。 前のエントリーでも書いているように、フリーソフトなのに高機能。(統計解析・グラフの種類が豊富) しかし、日本語での資料がまだ少ないのがちょっとイタイ…。 (最近は書籍でも多く診られるようになってきましたけどね!嬉しい限りです) ちょうど調べ物をしてたときに、「How Google and Facebook are using R」というエントリーを見つけました。 今日はその内容をちょっと日本語に訳した内容を紹介しようと思います。 紹介するサイトこの記事が書かれていたのは、Dataspora Blog というサイトで、データに関する(Big Data, open source analytics, and data visualization)記事をメインに書かれているようです。 (私は知らな
R と Python の連携を考える 最近 R による基本的なデータプロッティングやファイル入出力の方法について説明しました。 データ分析の言語としては Python ですべてをやろうという傾向があるようですが、やはり過去の膨大な R による資産は魅力的でそう簡単に切り捨てられるものではありません。 よくあるケースとしては、部分的なデータ解析については R を流用したいが、全体的なプログラミングは Python で書きたいというシーンでしょう。また、プロッティングだけ R でおこないたいという場合もあるでしょう。こんなとき Python と R で連携できれば問題が一気に解決して便利です。 Python から R を利用するライブラリ PypeR かつては RPy2 というライブラリが使われていたようですが、最近使われており主流なのは PypeR です。 PypeR のインストール インス
Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。 ・姫路市役所での事例 これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。 ※まだ不完全ですが情報を入手し次第アップデートしていきます。 1. 資料を探す場所 CRAN R本体、パッケージ、PDF資料などの置き場 Task Viewに分野ごとのまとめ Searchでパッケージや資料の検索 CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw) Rjpwiki 日本語で書かれている、これまでのRに関する資料の集大成 データの加工技、
URLYou can post either your article on Qiita or your blog post. About reserved postingIf you register a secret article by the day before the same day, it will be automatically published around 7:00 on the same day. About posting periodOnly articles submitted after November 1 of the year can be registered. (Secret articles can be registered anytime articles are posted.)
この記事は R Advent Calendar 2014 - Qiita の21日めの記事です。詳しくは RPubs - RFinanceJパッケージで振り返る日本の金融マーケット2014 をご覧ください、そして今年の相場で儲けた人は、ちゃんと私に申告して奢るようにしてください。 また、上記のドキュメントを作成する際に使用したR Markdownファイルは RMarkDownsForRPubs/RFinanceJ2014.Rmd at master · teramonagi/RMarkDownsForRPubs · GitHub です。dygraphsやrChartsの埋め込み、もろもろの設定などの参考になれば。
Hide Comments (–) Share Hide Toolbars
グローバルTokyoRで何話そうかなー、と思っていたんですがそう言えば主賓がvisualizationの人なんだったっけなぁということで、可視化の話にでもしようかなと。ということで、僕の大好きなネタでもやろうかと思います。 それは、「とにかく{arules} + {arulsViz}で可視化してしまえ」戦略。基本的に世の中のデータマイニングにせよ分類問題にせよ、実は様々な説明変数の共起(?)関係で表せることが多く*1、そういう時は何だかんだでassociation rulesを使うのが一番手っ取り早いんですよね。僕自身の勉強不足を補う目的からも(汗)、ちょっと書いてみようと思います。 アイテム間の条件付き確率たくさん→ベイジアンネットワークもどき→有向非循環グラフ 基本的に、association rulesはアイテム間の共起確率をある状態に対する条件付き確率として出すものです*2。そして
最近転職して、Rをメインで使用しています。(弊社のR使用率はなんと100%!) 今後も仕事を通じてRの普及と進歩に貢献していきたいと考えています。 今回の記事の更新はRAdventCalendar2012の一貫として更新しています。 ハッシュタグは#RAdventJPですので、こちらもぜひチェックしてみてください。 早くビールが飲みたいので、今日はアソシエーション分析の結果を可視化するパッケージのarulesVizの紹介をしてお茶を濁したいと思います。 アソシエーション分析とはなんぞやとかRでのアソシエーション分析の使い方については、Tokyo.R #22の発表資料が大変よくまとまっていてわかりやすいので、こちらをご覧になってください。これを読めばアソシエーション分析については基本を抑えることが出来ると思います。アソシエーション分析について知らない方はこの記事を読む前にこちらをご覧になって
相関ルール 頻出するアイテム間の何らかの組み合わせの規則をアソシエーションルールと呼ぶ。アソシエーションルールは連関ルール、関連ルール、相関ルールなどと呼ばれます。 「商品Aを買うと商品Bも買う」のようなルールを見つけ出すことを目標としています。 今回の例は、掃除機の購買動機に繋がる不満要素の組み合わせです。 これを特定し、その中でも特に強い不満点を解明して、商品開発に貢献させることを目標とします。 アンケートの設問 設問の形式 チェックボックス系の複数回答形式の設問 回答データ 水平展開形式のデータ サンプル毎に複数の設問への回答が存在し、1サンプル1レコードの形式であること。 集計データ 予め用意できるのであれば、SQLなどで集計データを作成しておくとグラフが描きやすくなります。 (※そこまで準備しなくとも、Rで図を出すことは可能です。) ※しかし、この表では集計されてしまっているので
※この記事は R Advent Calendar 2014 : ATND の 22 日目の記事です。 0. この記事の要約 R の foreach パッケージを改良して、デフォルトで並列計算するようにしたパッケージ pforeach を作りました。 pforeach - Easy to parallel processing in R これにより、R での並列計算を下記のようにシンプルに書くことができます。 library(pforeach) pforeach(i = 1:100)({ i ** 2 }) これは、従来の foreach で次のように書いたものと同じ動作をします。 library(foreach) library(doParallel) cl <- makeCluster(detectCores()) registerDoParallel(cl) foreach(i = 1
ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も) AITCオープンラボ 「R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜機械学習・データビジュアライゼーション事始め〜」 に行ってきた!その内容のうち、(順番違うけど)ビジュアライゼーションをメモメモ (基礎、機械学習、ビジュアライゼーション、Javascript連携と話は続く) なお、この講義の基礎、機械学習、ビジュアライゼーション編は http://www.slideshare.net/yasuyukisugai/r-28544592 の内容に沿って行われました。 (ソースプログラムはそのサイトより引用) ビジュアライゼーション ggplot2を使う install.packages("ggplot2") library(ggplot2) # qplotクイックプロ
1. Copyright © 2013 Advanced IT Consortium to Evaluate, Apply and Drive All Rights Reserved.Copyright © 2013 Advanced IT Consortium to Evaluate, Apply and Drive All Rights Reserved. 第2回 R言語で始めよう、データサイエンス! (ハンズオン勉強会) ~相関分析による需要予測編~ 2014年4月期 AITCオープンラボ 2014/04/28 2. Copyright © 2013 Advanced IT Consortium to Evaluate, Apply and Drive All Rights Reserved. •菅井 康之 • https://www.facebook.com/yasuyuki.s
はじめに 一言でいうと、Rstudio上でRマークダウンからHTML/PDF/MS Wordレポート、ウェブスライド、Shiny入りのレポートなどを作成できるようになりました。以下、解説です。 シリーズ Useful R 9 「ドキュメント・プレゼンテーション生成」 第8章ではRstudioのドキュメント生成支援機能について説明しています。 本書の内容は執筆時(2014年3月)の最新公式バージョン0.98.501をターゲットにしています。 2014年6月に最新公式バージョンが0.98.932となり、ドキュメント生成支援機能が大幅にアップデートされました。 ドキュメント変換にrmarkdownパッケージを採用しています。これに伴いユーザインタフェースにも若干の変更があります。rmarkdownパッケージやRマークダウンの書式の変更点については解説記事 (rmarkdownパッケージで楽々ドキ
この記事は Shiny 公式サイトのチュートリアルを翻訳したものです。 http://shiny.rstudio.com/tutorial/lesson1/ チュートリアル目次:http://d.hatena.ne.jp/hoxo_m/20151222/p1 LESSON1 ようこそ Shiny へ このレッスンは、Shinyアプリをすぐに作れるようになるためのものです。もし、まだ Shiny パッケージをインストールしていないなら、R を起動してインターネットにつなぎ、以下を実行してください。 このチュートリアルでは、RStudio のプレビュー版を使っていることを前提としています。プレビュー版は Shiny を簡単に動かせるような新機能が含まれています。プレビュー版はここからダウンロードできます。(※記事を書いた時点ではプレビュー版にしか無い機能を使っていましたが、現在はその機能は正式
knitr とは,R のパッケージのひとつでデータ分析のレポート作成に役立ちます. markdown 記法の中で R の処理を記述して,実行結果を HTML などに埋め込んだ状態で生成することができます. またこれらの記事では,R 自体の解説は行いません. あくまで,R を使っている,あるいはこれから使いはじめる人が knitr を使うことでより楽にレポートを作成できるような知識や技術の習得を目指します. 5分ではじめる knitr RStudio を使って knitr の使い方を体験 knitr ではじめるデータ分析レポート作成 ~基礎編~ ゴール:knitr を基本的に使えるような知識を身に付けて,R での分析結果を HTML として生成できるようになる knitr ではじめるデータ分析レポート作成 ~応用編~ (作成中) ゴール:knitr のおおよその機能を理解して使いこなせる 関
※この記事は R Advent Calendar 2014 - Qiita の 11 日目の記事です。 はじめに RFM 分析は、マーケティングの顧客分析でよく使われる手法です。 Recency(いつ買ったか)、Frequency(何回買ったか)、Monetary(いくら使ったか)を指標として、顧客をグループ化します。 RFM 分析が何なのか、何に使えるのかは、次のサイトの記事を読めば理解できると思います。 顧客分析の手法 #RFM分析 しかし、実際のデータにこの手法を適用しようと思ったとき、困ったことになります。 どのようにランクを区切ったら良いのか分からないのです。 上記のサイトにもこう書いてあります。 ランクをどこで区切るかは重要な問題で、業種、業界、商品や分析を行なう時期や、用いるデータの期間などによって、分けかたを慎重に検討する必要があります。 このランクを区切るという重要かつ難
2014-08-31 横浜市のオープンデータで人口ピラミッドを作ってみた R できそうなことをやってみよう。 Rの勉強をするにあたり、この本を注文しました。手を動かしながら学ぶ ビジネスに活かすデータマイニング作者: 尾崎隆出版社/メーカー: 技術評論社発売日: 2014/08/22メディア: 単行本(ソフトカバー)この商品を含むブログ (1件) を見る が、まだ来てません。 しかしながら、今日は今流行のデータサイエンティストたる夫が在宅している休日であります。そこで何かデータを触るべく、オープンデータを探していたら、横浜市の「よこはまオープンデータカタログ」というサイトに出会いました。 横浜市政策局 政策課 オープンデータの推進 よこはまオープンデータカタログ(試行版) 集計済みデータのため、簡単にできることは限られていそうでしたが、「人口データがあるなら人口ピラミッドできるじ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く