タグ

Rに関するmnruのブックマーク (27)

  • http://www.biwako.shiga-u.ac.jp/sensei/kumazawa/R/c2.pdf

    mnru
    mnru 2017/10/11
  • Does Julia have any hope of sticking in the statistical community?

    mnru
    mnru 2017/09/09
  • データ サイエンティスト のための新しい Python 環境 Rodeo がなかなかいい / Watch & try out python new IDE for data scientist - datalove’s diary

    ** Sorry, this note is Japanese only, but please take a look at some code snippets. Hope it helps you a bit! 唐突ですが、このブログの読者のみなさんってどんな環境でコード書いたり データ分析 したりしてるんでしょうか? たぶん、RStudio が一番メジャーかな?で、Jupyter / IPython notebook がそれに続き、以下、Anaconda とも縁の深い Spyder とかなんでしょうか。最近だと PyCharm とか使ってる人もいるのかも。 そんな環境に悩める子羊ならぬ データサイエンティスト のみなさん、(これまで R 使ってる人なら特に)朗報です。 Python のデータサイエンティスト向け開発環境に新しい選択肢「Rodeo」が加わりました。 英語版しかないせい

    データ サイエンティスト のための新しい Python 環境 Rodeo がなかなかいい / Watch & try out python new IDE for data scientist - datalove’s diary
    mnru
    mnru 2017/08/31
  • Rを薦める100+の理由 - RjpWiki

    RjpWiki Rを薦める100+の理由† (1) どんどん育つから -- 林 啓一 2003-06-19 (木) 03:53:04 (2) 関数がたくさん用意されているので,プログラムするのもす極楽。 -- 青木繁伸 2003-06-20 (金) 13:50:42 (3) プロ使用に耐える設計(ひょっとして短所?) -- 間瀬茂 2003-06-22 (日) 12:34:26 (4) unix系が好きな人には大変なじみやすい文法・関数名です -- 岡田 昌史 2003-06-22 (日) 22:26:24 (5) 充実したフリーなマニュアル、ヘルプ文章類。更新もしっかり(おかげで翻訳が追い付かない、悲鳴!) -- 間瀬茂 2003-06-26 (木) 18:29:51 (6) 一流の統計学者、各分野で実際に統計的手法を使っている・開発している研究者が自ら開発に積極的に参加 -- 2003

    mnru
    mnru 2017/08/14
  • R - Books

    Books related to R NOTE: modifications to this page have been suspended while the R webmasters consider how, or whether, to maintain the page in the future. This page gives a partially annotated list of books that are related to S or R and may be useful to the R user community. See also the list of other publications related to R. An alternative searchable listing of both sets together is availabl

    mnru
    mnru 2017/08/14
  • R – Pros and Cons

    mnru
    mnru 2017/08/14
  • 型安全性と統計計算 | POSTD

    私は大ざっぱに言って、統計学のコミュニティはコンピュータサイエンスの概念にもっと触れた方が恩恵を得られると考えています。その考えを基に、記事では、統計計算システムの振る舞いに関する規範論の展開に 型安全性 の概念を用いる可能性を説明します。また、そのような規範論によって、現行システムの誤用のされ方を明確にできることも論じます。それとともに、統計向けのより型安全な言語を実装しようという現実的提案に立ちはだかる数々の難題についても述べていきます。 コンピュータサイエンスにおける概念としての型安全性 Vijay Saraswat は、型安全な言語を以下のように定義しています。 ある言語内でデータに対して実行できる演算がそのデータの型に許可されたもののみであれば、その言語は型安全である。 個人的にはこの簡潔さは気に入っているのですが、いくつかの例を使って上記の定義を説明すれば多くの読者の皆さんに

    型安全性と統計計算 | POSTD
    mnru
    mnru 2017/08/07
  • データ欠損の状況を把握する - Python vs. R - Qiita

    はじめに データ分析でデータを与えられて最初に行うこととして,概略の内容把握がある.データを表の形にして,特徴量は何か,データのタイプは何かを理解しようとする.これと同時に行う作業が,欠損値についての調査である.データ欠損の有無は,データ操作に影響を及ぼすのでまず有無を確認し,さらに欠損値の頻度をみる.記事では,この作業について,PythonとRでどのように行うかについて確認していく. (プログラミング環境は,Jupyter Notebook + Python 3.5.2 および Jupyter Notebook + IRkernel (R 3.2.3) になります.) Pythonでのデータ欠損状況確認 データセットとして,Kaggleが提供する"Titanic"を用いることとした.データを見た方も多いと思われるが,これは,乗客の特徴量から「生存した」/「生存できなかった」を分類するも

    データ欠損の状況を把握する - Python vs. R - Qiita
    mnru
    mnru 2017/08/04
  • 「R」を初めて使うエンジニアが覚えておきたい、データ処理のコマンドあれこれ

    ビッグデータの流行によって分析ツールが注目を集めています。それらのツールのうちの1つがプログラミング言語のRです。この記事では、テキストファイル、CSVファイル、データベースからデータを抽出し、Webサーバーへ送信する方法を紹介します。 また新しい言語を習得しなければならないのかと心配していませんか? 答えはノーです。ほんの少しのコマンドだけ知っていれば大丈夫です。 なにかしらのプログラミング言語でWebアプリケーションを作った経験のあるプログラマーであれば、Rにデータをインポートして処理をし、必要な形式に出力できます。 注意:もしRにまったく馴染みがなければSitePointの記事『Introduction to R and RStudio』がおすすめです。R言語の概要や基コマンドが書かれています。今回の記事では、IDEのRStudioは使わずにターミナルで動くコマンドのみを紹介します

    「R」を初めて使うエンジニアが覚えておきたい、データ処理のコマンドあれこれ
    mnru
    mnru 2017/08/04
  • Rでデータ読み込みから前処理までのTips - Qiita

    Rでテキストファイルの読み込みからデータ加工の流れ(前処理)で覚えておくとかなり便利、あるいはよくハマるポイントを中心に。 細かい知識が多いのだがまとまったものがなかったのでまとめてみた。 ありがちなハマりを回避して作業効率を上げるために。 データの読み込み データファイルの読み込み プロジェクトごとにワーキングディレクトリをセットするといい CSVファイルの読み込み read.csv()はヘッダありが前提。 文字コード fileEncoding="文字コード名"で指定できる。Windowsで作ったCSVを読み込む際、BOMが付いていることがあるのでfileEncoding="UTF-8-BOM"とする 文字列の扱い 文字列が自動的にfactor型になるので、不都合な場合はstringsAsFactors=Fを指定する 欠損値の扱い 欠損値が空欄であったり、データベースからエクスポートした

    Rでデータ読み込みから前処理までのTips - Qiita
    mnru
    mnru 2017/08/04
  • R言語の過去と最新の動向

    連載「フリーソフトによるデータ解析・マイニング」は今月号をもって終了となります。 2003年8月に連載第1回として金明哲氏による「データ解析・マイニングとR言語」という記事が掲載されて以来、 約12年半149回に渡り、6名の執筆陣がR言語とデータ解析について解説してきました。 最終回となる今回は、過去10年余りのR言語の国内での普及、 そしてR言語の最新の動向について紹介しながら、有用な情報をピックアップしてみます。 なお今回の記事には著者の主観が多分に反映されていることをご承知おき下さい。 R言語の10余年史 コンピュータのバックアップ履歴を漁ってみたところ、著者自身は大学院生だった2003年頃からRを触り始めて、 2004年夏頃に研究のための分析ツールとしてRを導入していたようです。 この頃のRのバージョンは1.7から1.8だったように記憶しています。 連載の開始時期と著者のR利用

    mnru
    mnru 2017/08/01
  • 残りの私たちにとって、Rが最高のプログラミング言語である理由 | POSTD

    訳注:2017/5/23、いただいた翻訳フィードバックをもとに記事を修正いたしました。 私はRを使用して6年以上になります。Rとの最初の出会いは、財政学におけるモンテカルロシミュレーションの博士課程の時で、紹介してくれたのはWolfgang Hörmannでした。プログラミング言語に関しては、それ以前にもいくつか使ったことがあり、最後のものはC++(これも私は大好きです)でしたが、それらのどれもRほど 便利 ではありません。 残りの私たちにとってRが最高の言語である理由をリストアップする前に、まず “残りの私たち” の定義を明確にしておきましょう。残りの私たちとは、ExcelユーザやSPSSユーザ、そしてコンピュータサイエンス(CS)界の外にいる人々(*)、つまり簡潔さを目指して努力しながら、同時にパワーと柔軟性を追求する “プログラムの利用者” のことです。Rは、そんな 私たち にとって

    残りの私たちにとって、Rが最高のプログラミング言語である理由 | POSTD
    mnru
    mnru 2017/08/01
  • Pythonでのデータ分析初心者がまず見るべき情報源のまとめ - Qiita

    データ分析言語としてデータサイエンスの世界での存在を日々増している(と言われる)PythonPythonでのデータ分析、特にPandasの使い方についてまとめてみました。 ・Rユーザーの方がPythonを使いたい場合には特に有用だと思います。 ・基的なデータハンドリングの方法に主眼をおいています。 RユーザーがPandas,Numpyを使う場合の早見表 【Slide Share】Python for R uses Rで使う記法をPythonで再現するにはどうしたらいいかの 比較早見表が列記されており、RでやっていたことをPythonでやろうと 思ったらかなり有用だと思います。 http://www.slideshare.net/ajayohri/python-for-r-users 【Pandas Official】Pandas -comparison with R 上記と同様、Rで

    Pythonでのデータ分析初心者がまず見るべき情報源のまとめ - Qiita
    mnru
    mnru 2017/07/31
  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • プログラマーのためのR言語入門 - Qiita

    なにやらR言語界隈が盛り上がってるそうで。 こちらのIEEE SPECTRUMが発表している2015年の人気言語ランキングではついに6位にまで登ってきています。 この流れにのってR言語を始める人も多いと思いますので、ポイントをまとめておくメモです。 統計とか機械学習とかの内容ではなくプログラム言語としての部分ですのでご注意を。また、1からしっかりではなく、他の言語と違っているところ中心です。 追記: やっと続編も書けました。 プログラマーのためのR言語入門 その2 ~分析・表示編~ ざっくりとどんな言語? 統計の機能が盛りだくさんのスクリプト言語です。 似ている言語は?と聞かれるとPythonと答えています。 環境 以下をインストールします。 R言語 RStudio RStudioはR用のIDEです。R言語単体のインストールでも簡易なエディタはついてきますが、何かと便利なRStudioがお

    プログラマーのためのR言語入門 - Qiita
    mnru
    mnru 2017/06/14
  • RStudio Shiny チュートリアル レッスン1 ようこそ Shiny へ - Qiita

    この記事は Shiny 公式サイトのチュートリアルを翻訳したものです。 http://shiny.rstudio.com/tutorial/lesson1/ チュートリアル目次:http://d.hatena.ne.jp/hoxo_m/20151222/p1 LESSON1 ようこそ Shiny へ このレッスンは、Shinyアプリをすぐに作れるようになるためのものです。もし、まだ Shiny パッケージをインストールしていないなら、R を起動してインターネットにつなぎ、以下を実行してください。 このチュートリアルでは、RStudio のプレビュー版を使っていることを前提としています。プレビュー版は Shiny を簡単に動かせるような新機能が含まれています。プレビュー版はここからダウンロードできます。(※記事を書いた時点ではプレビュー版にしか無い機能を使っていましたが、現在はその機能は正式

    RStudio Shiny チュートリアル レッスン1 ようこそ Shiny へ - Qiita
    mnru
    mnru 2017/06/09
  • Python vs R for Data Science: Which Should You Learn?

    Python vs R for Data Science: Which Should You Learn? This guide will help you answer one of the most frequently asked questions of newcomers in data science and help you choose between R and Python. If you are reading this article, you are likely just at the beginning of your data science journey. You will probably know by now that learning to code is a critical milestone for every aspiring data

    mnru
    mnru 2017/04/21
  • R言語で何ができる?

    昨今、ビッグデータというキーワード、およびその関連技術は非常に注目を集めており「R言語」というフレーズを耳にする機会も多くなってきたように感じます。 稿は利用例を通じてR言語の概要、イメージを掴んでいただくことに加え、R言語を取り巻く業界の動向についてご紹介することを目的としています。 利用例としては、私がとあるシステム運用において実施していた分析を簡略化した形でご紹介します。システム統計情報に対する分析事例なので、ITシステムの設計や運用に携わる方であれば目にすることの多い、なじみ深いデータ分析と言えるのではないでしょうか。 なお、稿では統計についての数学的な解説は極力行わず、R言語の利用者目線でのご紹介に重点を置きます。 対象読者としては、 などを想定しています。 また、Rは統計的なデータ処理を行うCUIベースのプラットフォームであり、CUI操作、スクリプト言語の経験、統計学に対す

    R言語で何ができる?
    mnru
    mnru 2012/08/04
  • JIN'S PAGE

    R、R言語、R環境・・・・・・ Rのダウンロードとインストール リンク集 題名 Chap_01 データ解析・マイニングとR言語 Chap_02 Rでのデータの入出力 Chap_03 Rでのデータの編集と演算 Chap_04 Rと基統計量 Chap_05 Rでの関数オブジェクト Chap_06 Rでのデータの視覚化(1) Chap_07 Rでのデータの視覚化(2) Chap_08 Rでのデータの視覚化(3) Chap_09 GGobiとデータの視覚化(Rgobi) Chap_10 Rと確率分布 Chap_11 Rと推定 Chap_12 Rと検定 Chap_13 Rと分散分析 Chap_14 Rと回帰分析 Chap_15 Rと重回帰分析 Chap_16 Rと一般化線形モデル Chap_17 Rと非線形モデル Chap_18 Rと判別分析 Chap_19 Rと樹木モデル Chap_20 WEK

    mnru
    mnru 2012/02/03
  • 生態学データ解析 - R 関連の参照

    ここでは統計ソフトウェア R 全般に関する WWW と文献の情報を紹介します R は統計ソフトウェア (あるいは「データ解析環境」とも呼ばれています) でデータ解析と作図の統合的な環境を提供してくれます R は free software です R のインストール, R のとりかかり, R プログラミングの基礎 (生態学会の自由集会) 久保がインストールしてる R package の help Rcpp めも R for Data Science (もくじ) Web 書籍 Web R の中心的な website は http://www.r-project.org/ です R のインストール 参照 R サイト検索 (RsiteSearch) http://search.r-project.org/cgi-bin/namazu.cgi Wikibooks の "R プログラミング" http

    mnru
    mnru 2011/11/25