Welcome the R graph gallery, a collection of charts made with the R programming language. Hundreds of charts are displayed in several sections, always with their reproducible code available. The gallery makes a focus on the tidyverse and ggplot2. Feel free to suggest a chart or report a bug; any feedback is highly welcome! Stay in touch with the gallery by following it on Twitter. Oh and if you wa
R言語を学ぶのは難しい、という話のLT。 (2022/04/17: 誤記を修正)
2022/6/19 スクレイピングが可能であることを確認しました。 スクレイピングプログラムを英文でも取得できるよう改善しました。 ●はじめにAmazonで買い物をする際、レビューを参考にしない方はいないでしょう。 高評価であっても低評価であっても、レビューは貴重なユーザーの意見であり、情報の宝庫です。しかし大量にレビューがあると全て目を通すのには時間がかかりますし、高評価も低評価も様々で情報の整理は難しいですよね。もっと良い感じに要約、数値化できれば...ということで、今回はRを使ってAmazonレビューの収集と分析をしました。 スクレイピング禁止規定についてはこちらのサイトと同様の立場ですが...しっかりウェイトタイムを入れてAmazonさんのサーバーのご迷惑にならないよう、ログインせず自己責任でゆっくりやりましょう...。 (そしてお世話になったら買いましょう。) 当方Windows
このコードについて、twitter上で「Juliaなら数十秒で終わるのにRだとめっちゃ時間かかったんだろうな…」的な発言が流れてきたのを見かけて、本当にそうなのか気になったので少し調べました。 そもそもRのループは遅いのか? たしかに、Rのforループが非常に遅いとされていた時代はありました。繰返し処理はなるべくベクトル化して書くべきものであって、forを書くというのは可能であれば避けるべき作法でした。 しかし、R 3.4.0からJITコンパイラが同梱されており、これがデフォルトでONになっている恩恵で、現代のRのforループの速度は相当に改善されています。場合によってはforを書いたほうが速度的に有利なことすらあります。 やってみる まあともかくやってみましょう。 実測とプロファイリング まず「そもそも元のコードがどれだけ時間がかかるのか」を確認しておくと、私の手元のちょっと古くなってき
〇はじめに 前回は文書中の単語ごとの出現頻度を計測しました。 www.anarchive-beta.com今回は視覚化していきます。前回のようにテキストを数値で捉えたものを、視覚的に捉えられる形式に加工します。具体的には、ネットワークグラフとワードクラウドを作成します。 ・参考書籍 『Rによるテキストマイニング入門』石田基広,森北出版株式会社 『Rによるやさしいテキストマイニング』シリーズ,小林雄一郎,オーム社 〇やってみた ・分析対象データ 前回と同様にモーニング娘。'18のシングル楽曲を利用します。ファイルの構成は以下の通りです。 ディレクトリ名はmor18 ファイル名:曲タイトル mor18_65a.txt:A you Happy? mor18_65b.txt:A ganna mor18_66a.txt:フラリ銀座 mor18_66b.txt:自由な国だから mor18_66c.tx
Welcome This is the website for “Hands-On Programming with R”. This book will teach you how to program in R, with hands-on examples. I wrote it for non-programmers to provide a friendly introduction to the R language. You’ll learn how to load data, assemble and disassemble data objects, navigate R’s environment system, write your own functions, and use all of R’s programming tools. Throughout the
Writing a domain-specific language (DSL) is a powerful and fairly common method for extending the R language. Both ggplot2 and dplyr, for example, are DSLs. (See Hadley’s chapter in Advanced R for some elaboration.) In this post, I take a first look at NIMBLE (Numerical Inference for Statistical Models using Bayesian and Likelihood Estimation), a DSL for formulating and efficiently solving statist
データクリーニングが繁雑な作業であることを示すために、政府の統計データから日本の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。 はじめに データクリーニングは、データ分析の際に非常に重要なプロセスの1つであるが、データ分析の教科書では必ずしも十分に扱われていない。そこで、現実のデータクリーニングがどのように行われるかについて、一事例を紹介したいと思う。具体的には、統計処理に適したプログラミング言語のRを用いて、粗悪なデータから簡単な折れ線グラフが作成できる程度のきれいなデータにするまでのデータクリーニングを実施していく。 本記事の対象読者 本記事は、既存のデータに対して自らの手でデータ分析を実施している人、または実施しようと考えている人を主な対象にしている。データ分析の際にど
R の changepoint パッケージの使い方についてです。 第66回R勉強会@東京(#TokyoR)発表資料 https://atnd.org/events/92993
Rには、分析手法や可視化手法を試すことのできる多くのデータセットが同梱されています。 その数は2016年12月現在で104個にも達していますが、その大半はあまり紹介されることがなく、知る機会も多くはありません。「ヘルプが英語で書かれている」というのもその要因の1つでしょうが、「数が多すぎて、何に使えるのか把握しきれない」という理由も大きいのではないでしょうか。 実は、 間瀬先生のR 基本統計関数マニュアル の巻末 パッケージ 'datasets' の情報 - RjpWiki R 3.3.1の datasets パッケージ中のオブジェクトの全ヘルプドキュメント一覧 (Google Docs) などに情報がまとまっているのですが、アルファベット順に表記されているため、データの「構造」でソートしたものがあってもいいんじゃないかな、とふと思いました。 これらのデータについておおまかに分類して、概要
はじめに Hadley Wickham著「R言語徹底解説」を訳者の方よりご恵贈いただきました.ありがとうございます!御礼と宣伝,また自分の復習をかねて,紹介記事を書きたいと思います. 本書「R言語徹底解説(原著 "Advanced R")」は,著名なR開発者であるHadley Wickhamが,Rの基本的な構造から,メタプログラミングやパフォーマンス改善といった高度な話題に至るまで,プログラミング言語としてのRの全体像を詳しく解説したものです. 2016年の今,データ分析にRを利用しているという人でggplot2やdplyrといったパッケージを知らない人はいないでしょう.本書の著者Hadley Wickhamはこれら広く利用されているパッケージの開発者です.githubを見れば分かる通り,著者は現在RStudioに所属しており,上に挙げたような著名なパッケージを始めとする数多くのRパッケー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く