タグ

tipsとRに関するh1saoのブックマーク (30)

  • ggplot2に関する資料まとめ - Qiita

    そろそろワンストップなまとめ記事があってもいいはずと思ったので、個人的なメモとしてまとめました。 2016/06/10追記: 資料1件追加 2016/03/15追記: ggplot2 v2向けに一部修正 ggplot2のイメージをつかもう まずはこのggplot2がどういうものなのかをつかみましょう。 ggplot2の完全な初心者向け ggplot2に初めて触れるという方は、まずこのスライドを一読されるのをオススメします: ggplot2によるグラフ化@HijiyamaR#2 ※Slideshareリンク ggplot2を理解するためには、その文法をイメージできるようになることが近道です。このスライドは従来のplotとggplot2との違いをわかりやすく解説してあります。まずはレイヤーの感覚をつかむためにも、提示してあるサンプルコードをひたすら打ちましょう。手を動かす、大事。 ggplot

    ggplot2に関する資料まとめ - Qiita
  • Rのライブラリとかチートシートとか基本操作とかメモ - Qiita

    ## SQLでいうJoin hoge.fuga <- merge(hoge, fuga, by = c( "user_id", "app_name" ) ) ## SQLでいうLeft Outer Join hoge.huga.foo <- merge( hoge.huga, # 結合対象データ(X) dpu, # 結合対象データ(Y) by = c("log_date", "app_name", "user_id"), # 結合対象データのカラム all.x = T # Left Join 指定 ) ## 結合した側のデータの列名は.gをつける hoge <- merge( imp, goal, # tmpとgoalを結合 by="transaction_id", # transaction_idで結合 all.x=T, # 外部結合 suffixes=c("",".g") # 結合下側

    Rのライブラリとかチートシートとか基本操作とかメモ - Qiita
    h1sao
    h1sao 2015/11/09
  • 時系列データ分析の初心者に必ず知ってもらいたい重要ポイント ~ 回帰分析 ・相関関係 分析を行う前に必ずやるべきこと(データの形のチェックと変形) - Qiita

    回帰分析 や 相関関係分析 を 行う前に、まず一番最初に、「データの検証」と「データの加工」が絶対に必要 上記のステップを踏まないと、例え、Excel や SPSS、Rで 回帰分析・相関関係を事項して、「実行エラー」起こらないで、ちゃんと数字が画面に出ても、それは『間違った数字』である可能性が非常に高い 回帰分析 や 相関関係分析に使えるデータは、次の 『 NG条件 』にあてはまらないデータだけ 「データの形」必須条件 ~その1 データ期間を通じて、データの平均値が変わるデータだとNG ⇒ 折れ線グラフでチェック必須! 「データの形」必須条件 ~その2 データ期間を通じて、データのぶれ・ばらつきが変わるデータだとNG ⇒ 折れ線グラフチェック必須! 「データの形」必須条件 ~その3 データ期間を通じて、データの値が直線的 or 曲線的に、増加する・減少するデータだとNG ⇒ 折れ線グラフチ

    時系列データ分析の初心者に必ず知ってもらいたい重要ポイント ~ 回帰分析 ・相関関係 分析を行う前に必ずやるべきこと(データの形のチェックと変形) - Qiita
  • R programming — Watallica metallicus

    R programming¶ R Project Homepage http://www.r-project.org/ Comprehensive R Archive Network (CRAN)

  • dplyrを使いこなす!基礎編 - Qiita

    はじめに 4月ということで、新卒が入ってきたりRを使ったことないメンバーがJOINしたりしたので、 超便利なdplyrの使い方を何回かに分けてまとめて行きます。 Rは知らないけど、SQLとか他のプログラミング言語はある程度やったことあるみたいな人向けです。 dplyrを使いこなす!シリーズ 基礎編以外も書きましたので、↓からどうぞ。 * dplyrを使いこなす!Window関数編 * dplyrを使いこなす!JOIN編 dplyrとは データフレームの操作に特化したパッケージです。 Rは基的に処理速度はあまり早くないですが、dplyrはC++で書かれているのでかなり高速に動作します。 ソースの可読性もよくなるので、宗教上の理由で禁止されている人以外は使うメリットは大きいです。 処理可能なデータサイズの目安 あくまでも個人の環境に強く依存した感覚値ですが、1000万行、100MBぐらいのデ

    dplyrを使いこなす!基礎編 - Qiita
  • Rデータフレーム自由自在

    This document summarizes information about a person named Takeshi Arabiki. It includes: 1. Their Twitter handle is @a_bicky and ID is id:a_bicky. 2. A link to their blog on Hatena is provided. 3. They have written books and slides about using R and SciPy. 4. Links are provided to their slideshare presentations about using Twitter and R.Read less

    Rデータフレーム自由自在
    h1sao
    h1sao 2015/10/31
  • e-Stat APIをRから使う - Technically, technophobic.

    ほぼほぼこの記事に書いてある内容なんですけど、httrでやってみたのでメモ。 e-Stat APIとは 政府統計の総合窓口(e-Stat)で提供している統計データを入手できるAPIです。ユーザ登録してAPIキーを生成すると使えます。 今のところ、以下の種類のAPIが用意されています。形式はXMLとJSONとJSONPがありますが、今回はJSON形式のでやってみるので、jsonが返ってくるリクエストURLを書き添えています。 統計表情報取得(getStatsList):統計表の検索 メタ情報取得(getMetaInfo):統計表のメタ情報を取得 統計データ取得(getStatsData):統計表のデータを取得 データセット登録(postDataset):統計データの取得条件を登録しておける データセット参照(refDataset):登録されている取得条件を参照 データカタログ情報取得(get

    e-Stat APIをRから使う - Technically, technophobic.
  • 第2回 レポートづくりを加速せよ ~R Markdown環境の導入&チュートリアル~ | gihyo.jp

    前回はレポートづくりのオートメーション化がもたらすメリットについてやや概念的な説明をしました。今回はR Markdown環境を導入し、レポート作成の手順を説明します。実際に簡単なレポートづくりを体験して、R Markdownの威力を味わってください。 また、実務を想定した(とは言っても非常に単純化したものですが)2種類のチュートリアルを用意しましたので、これらのチュートリアルを通してオートメーション化されたレポートづくりを自分の仕事の中でどう活かすか想像してみてください。 なお、連載記事に関する疑問・質問・コメントなどは著者Twitterアカウント(@kohske)でも受け付けていますのでお気軽にどうぞ。 R Markdown環境の導入 R Markdownを利用するには、 R {rmarkdown}パッケージ pandoc の3つのツールを導入する必要があります。 PDF形式のレポート

    第2回 レポートづくりを加速せよ ~R Markdown環境の導入&チュートリアル~ | gihyo.jp
  • RMeCabのインストール - Qiita

    Mavericks に RMeCab 0.996 をインストールする方法。 ( https://sites.google.com/site/rmecab/home/rmecab_0-9998 の手順に従う ) MeCab 0.996 のインストール https://code.google.com/p/mecab/downloads/list から mecab-0.996.tar.gz をダウンロードしておく。 $ tar zxvf mecab-0.996.tar.gz $ cd mecab-0.996 $ ./configure --with-charset="utf-8" $ make $ sudo make install

    RMeCabのインストール - Qiita
    h1sao
    h1sao 2015/10/08
  • ■『Rによる空間データの統計分析』で空間データの可視化手法を学ぶ(その2): kiyomisのブログ

    ■『R による空間データの統計分析』で空間データの可視化手法を学習する(4章の一部) ●書籍 『R による空間データの統計分析』 古谷知之 (著) 朝倉書店 (2011/6/10) ※具体的にコードを入力しながら学習することができると思います. ●参照サイト 『空間データの統計分析』 サイト内のデータを利用させて頂きました.ここに記して感謝の意を表します. http://web.sfc.keio.ac.jp/~maunz/wiki/index.php?%B6%F5%B4%D6%A5%C7%A1%BC%A5%BF%A4%CE%C5%FD%B7%D7%CA%AC%C0%CF ※Rのバージョンは2.15.1で行いました. 4.1 等量分類  p.44 library(maptools) library(classInt) jpn_pref <- readShapePoly("C:/rkukan_

    ■『Rによる空間データの統計分析』で空間データの可視化手法を学ぶ(その2): kiyomisのブログ
    h1sao
    h1sao 2015/04/08
  • 一歩進んだRとの付き合い方 - Qiita

    どうも、R歴4年目にしてR初心者勢です。こちらは2015年にRをはじめたい、更に知識を高めたい人に向けた記事と自分の抱負になります。 都度、参考になるやURLを書いているので詳しくはそちらをご覧ください。 これからRをはじめる、ほとんどR使っていない人向け はじめに: どうしてRなのか よく言われることですが、 オープンソースでの開発 -> どういう機能をもっているか、どのように処理されるかがわかる マルチプラットフォームでの利用 -> 環境を選ばずどこでも同じように作業できるというのは大事 機能拡張(パッケージ、ライブラリ)に優れる -> 必要は発明の母の精神。俺がこういう機能欲しいから作るぜ★ ということを私は挙げます。 海外でもRは人気ですね -> TIOBE Software: Tiobe Index(これからはじめたいプログラミング言語としてRとSwiftへの注目が高まっている

    一歩進んだRとの付き合い方 - Qiita
    h1sao
    h1sao 2015/03/30
  • 好きなJavascriptの可視化パッケージをRの世界にサクッと持ち込む(htmlwidgets) - Technically, technophobic.

    追記(12/24):これでうまく動いたと思ってたんですが、まだRmarkdownではうまくグラフ描けないようです。。すみません。 追記(12/26):YAMLで指定するのをd3.jsではなくd3.min.jsに変えれば動くことが分かりました(.minもBowerがダウンロードしてくれてるのでパス変えるだけでOK)。原因は判明していますが、けっこう長くなりそうなので後日別の記事を書きます。。 追記(12/27):書きました → htmlwidgetsでD3.jsを使おうとしたら文字コードの闇に飲まれかけた話 - Technically, technophobic. 追記('15/01/02):pandoc側で修正が入ったので(Issue #1842)、minifyされてないファイルでもそのうち動くようになるはずです。 ここまでちょこまかと記事を書いてきましたが、いよいよ自分で可視化ライブラリ

    好きなJavascriptの可視化パッケージをRの世界にサクッと持ち込む(htmlwidgets) - Technically, technophobic.
  • ESTRELA連載記事「Rとウェブの融合」

    2014年7月号より、公益財団法人統計情報研究開発センターが発行する統計と情報の専門誌「エストレーラ」で、「Rとウェブの融合」と題して記事を連載しています。ウェブ上での記事公開の許可を頂いたのでここに公開します。なおウェブ公開記事は校正前の原稿なので誌上記事とは文章表現等が多少異なりますが、内容には変わりはありません。 Rとウェブの融合(1)ーrChartsの基礎ー (2014年7月号) Rとウェブの融合(2)ーrChartsの利用例ー (2014年8月号) Rとウェブの融合(3)ーrChartsの応用例ー (2014年9月号) 大規模データの高速処理 ーdata.table、dplyrー (2014年10月号) Rとウェブの融合(4)ーrmarkdownー (2014年11月号) Rとウェブの融合(5)ーslidify、R Presentationー (2014年12月号) Rとウェブの

  • 裏 RjpWiki

    算額(その2008) (23) 兵庫県姫路市広畑区西蒲田 天満神社 明治21年(1888) 近畿数学史学会:近畿の算額「数学の絵馬を訪ねて」,平成4年5月16日 初版第一刷,大阪教育図書株式会社,大阪市. キーワード:円4個,外円 外円の中に等円 3 個を容れる。外円の直径が 13 寸のとき,等円の直径および(図に示す)矢の長さはいかほどか。 外円の半径と中心座標を R, (0, 0) 等円の半径と中心座標を r, (0, R - r), (r, y) とおき,以下の連立方程式を解く。 include("julia-source.txt"); using SymPy @syms R::positive, r::positive, y::negative; eq1 = r^2 + (R - r - y)^2 - 4r^2 eq2 = r^2 + y^2 - (R - r)^2 res = s

    裏 RjpWiki
  • 前処理なしのトランザクションデータを{arules}パッケージで読み込む方法 - 渋谷駅前で働くデータサイエンティストのブログ

    実は僕は結構頻繁に{arules}パッケージを使うんですが*1、個人的には汎用性を考えて必ず素性ベクトルの形になるようにデータを前処理して読み込むようにしています。例えばこんな感じ。 ビール ソーセージ 牛肉 ... 1 0 1 ... 0 1 0 ... 1 1 1 ... ... ... ... ... なのですが、場合によっては前処理なしでただベタっとアイテムリストが個々のトランザクションごとに並んでるだけのデータを扱わなきゃいけないことも多いと思います。つまり、こんな感じのデータです。 ビール, 牛肉 ソーセージ ビール, ソーセージ, 牛肉 ... こういう場合、素性ベクトルの形に直そうとすると際限なくカラム方向に伸びていってしまうことが多く、前処理自体が非常に厄介になったりします。そこで、そういう時に出来る限り面倒な操作をせずに{arules}パッケージで扱える形に読み込む方法

    前処理なしのトランザクションデータを{arules}パッケージで読み込む方法 - 渋谷駅前で働くデータサイエンティストのブログ
    h1sao
    h1sao 2015/01/30
  • アソシエーションルール(連関規則・相関ルール):R言語

    分析に使われる場面 † 観光関連メディア(HPなど)の閲覧履歴から、どのページとどのページがよく閲覧される傾向にあるかを見いだす。 観光行動・交通行動調査などから、どの場所を訪問した人が別のどの場所を訪問する傾向があるかを見いだす。 ある観光商品を好む人は、別のどのような観光商品を好む傾向があるのかを見いだす。 ↑ ライブラリの読み込み † Rでアソシエーションルール分析を行うために、arulesというパッケージを読み込みます。 Windowsの人は、以下の手順でパッケージを読み込んでください。 RGui画面上のメニューバーから、「パッケージ」→「パッケージのインストール」→「CRAN mirror」から適当なミラーサイトを選ぶ→「Packages」リストから「arules」をんでOKボタンをクリックする 再びRGui画面上のメニューバーから、「パッケージの読み込み」→選択画面から「aru

    h1sao
    h1sao 2015/01/30
  • R.4.05. データフレーム型 | R Financial & Marketing Library

  • Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~

    Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。 ・姫路市役所での事例 これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。 ※まだ不完全ですが情報を入手し次第アップデートしていきます。 1. 資料を探す場所 CRAN R体、パッケージ、PDF資料などの置き場 Task Viewに分野ごとのまとめ Searchでパッケージや資料の検索 CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw) Rjpwiki 日語で書かれている、これまでのRに関する資料の集大成 データの加工技、

    Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~
  • R システム を用いた統計処理/データマイニング

    h1sao
    h1sao 2014/12/24
  • 統計解析ソフトRのスクリプト集 名古屋大学補助教材(石井秀宗)