タグ

Rに関するfermiのブックマーク (13)

  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • 競馬の予測をガチでやってみた - stockedge.jpの技術メモ

    的に競馬なんてやるべきではないと私は思っている。胴元の取り分が多いからだ。宝くじに比べればまだましだが、それでも賭け金の20~30%は胴元に取られることになる。*1 しかし今回は、ちょっと思い立って競馬の予測をやってみることにした。 理由は馬券の安さだ。私は現在、資金量が少ない人間でも不利にならない投資先を探しているのだが、馬券の一枚100円という安さは魅力的に映る。株の場合にはどんな安い株であれ最低購入額は数万円以上*2なので、ある程度まとまった資金が必要になる。 また、競馬には技術介入の余地(努力次第で勝利できる可能性)がある。 例えばこんな例がある。 160億円ボロ儲け!英投資会社が日の競馬で荒稼ぎした驚きの手法 - NAVER まとめ 彼らは統計解析によって競馬で勝っており、その所得を隠していたらしい。こういうニュースが出るということは、解析者の腕次第では競馬で勝てる可能性が

    競馬の予測をガチでやってみた - stockedge.jpの技術メモ
  • Pythonや機械学習、そして言語の競争について – 極めて主観的な見地から | POSTD

    (訳注:2016/1/5、いただいた翻訳フィードバックを元に記事を修正いたしました。) よくある主観的で痛烈な意見を題名に付けたクリックベイト(クリック誘導)記事だろうと思われた方、そのとおりです。以前指導してくれた教授から教わったある洞察/処世術は、些細でありながら私の人生を変えるマントラとなったのですが、私がこの記事を書いたのはそれによるものです。「同じタスクを3回以上繰り返す必要があるなら、スクリプトを書いて自動化せよ」 そろそろ、このブログはなんだろうと思い始めているのではないでしょうか。半年振りに記事を書いたのですから。ツイッターで書いた Musings on social network platforms(ソーシャル・ネットワークプラットフォームについてじっくり考える) はさておき、この半年の間書き物をしていないというのはうそです。正確には、400ページの を書きました。

    Pythonや機械学習、そして言語の競争について – 極めて主観的な見地から | POSTD
  • Rで文芸的プログラミングがしたい - 300億円欲しい

    Rの話です. 文芸的プログラミングとは 文芸的プログラミングってなんですかね. その説明から入ります. ソースコードを読んでも, コードが何をしているのか分からないこと. ありますよね. 自分が書いたコードなんだから覚えているだろ...と甘えて, コメントをサボってしまいます. 結果理解できずに, また最初から書き直す羽目になります. アホですね. 解決策. コードをそのままドキュメントにすればいいんです. これが文芸的プログラミングだ....と思っています. 解説を書きながらコードを書くスタイルです. 文芸的プログラミング - コンピュータサイエンスの第一人者 Donald Knuth博士が提唱しているプログラミングスタイル。 Rのknitrで文芸的プログラミング ~knitr+pandocではじめる~『R MarkdownでReproducible Research』 from ter

    Rで文芸的プログラミングがしたい - 300億円欲しい
  • 一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家

    久しぶりの投稿です。この一年間、Rの勉強会などに参加したり主催したりしてきて、後輩や勉強会の方々の話をいろいろ聞くとこができました。そんな中、一年間でRと統計学・機械学習を身に付けれるようなフローを作れるかも?と思ったので、ここで記録しておきます。統計学や機械学習は理論を勉強するだけでなく、Rで実際に解析してみることで、より理解が深まります。 ステップ1. 分布・検定 理論 統計学入門 (基礎統計学?) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メディア: 単行購入: 158人 クリック: 3,604回この商品を含むブログ (79件) を見る R Rによるやさしい統計学 作者: 山田剛史,杉澤武俊,村井潤一郎出版社/メーカー: オーム社発売日: 2008/01/25メディア: 単行購入: 64人 クリック: 782回この商品を含

    一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家
  • Rでの自作パッケージの作り方 - データサイエンティスト上がりのDX参謀・起業家

    ふと自作パッケージを作りたい!!と思って挑戦し、なんとか調べながら作成することが出来ました。 R中級者になると自作関数も増えてきて、投稿目的でなくてもパッケージ管理したくなると思います。 パッケージ作成の大きな流れはこんな感じ 自作関数&データをRコンソールに読み込む package.skeleton関数でパッケージのひな型を作る 説明ファイルの修正をする(DESCRIPTIONファイル、.rdファイル) コマンドプロンプトかターミナルでチェックとビルドを行う 紹介しているブログはいくつかありましたが、自分がネットで探してもよくわからなかった部分をブログで紹介します。 結論的には、少しCMDが使えれば自作のパッケージは作れます。 何段階か壁があると思いますが、多くの人がつまづくのは以下の点だと思う。 package.skeleton関数が上手くいかない description、rdファイ

    Rでの自作パッケージの作り方 - データサイエンティスト上がりのDX参謀・起業家
    fermi
    fermi 2014/05/07
  • Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~

    Rは統計解析を行うことができる強力なツールです。計算上の信頼性はとても高く、世界中の分析者が日々分析用パッケージを公開しております。近年では行政機関で使われているという事例もちらほら聞きます。 ・姫路市役所での事例 これまでSASは使ってきたけどRは全く使ったことがない!JAVAとかC++とかガリガリ書けるけどRはよく分からない!という方々がすんなりRの世界に入れるよう、資料の探し場所や導入部分をまとめておきます。 ※まだ不完全ですが情報を入手し次第アップデートしていきます。 1. 資料を探す場所 CRAN R体、パッケージ、PDF資料などの置き場 Task Viewに分野ごとのまとめ Searchでパッケージや資料の検索 CRANの読み方は「しーらん」派と「くらん」派でわかれる(どっちでもいいw) Rjpwiki 日語で書かれている、これまでのRに関する資料の集大成 データの加工技、

    Rを使えるようになるための10のこと - Issei’s Analysis ~おとうさんの解析日記~
    fermi
    fermi 2014/05/07
  • Index of /doc/contrib/manuals-jp

    Index of /doc/contrib/manuals-jp NameLast modifiedSizeDescription Parent Directory  - Mase-Rstatman.pdf2009-06-03 16:24 2.9M R-admin-jp.v15.pdf2003-06-24 05:52 171K R-admin-jp.v15.ps.gz2003-04-01 11:38 194K R-data-jp.v15.pdf2003-06-24 05:52 201K R-data-jp.v15.ps.gz2003-04-01 11:38 240K R-exts.jp.pdf2003-06-24 05:52 337K R-exts.jp.ps.gz2003-04-01 11:38 400K R-intro-170.jp.pdf2003-06-24 05:52 502K R

  • Rにおける大規模データ解析(第10回TokyoWebMining)

    1. Rにおける大規模データ解析 ~bigmemoryパッケージ~ 2011年2月27日 第10回 TokyoWebMining 1st week @sfchaos 2. 発表の趣旨 � Rは便利な統計解析ツールとして注目を浴びていますが, 大規模なデータを扱うことが得意ではありません. � そこで,発表では,大規模データを扱うパッケージの 一つであるbigmemoryとその兄弟パッケージについて紹 介します. � HadoopやMahoutなどを使うほどではなく,かといってR の標準機能だけでは扱いに困るほどの規模のデータを扱 う方のお役に立てれば幸いです. 2

    Rにおける大規模データ解析(第10回TokyoWebMining)
  • RのffとbigmemoryとRevoScaleRとを比較してみた

    3. サイバー系 自己紹介  和田 計也(@wdkz)  静岡県袋井市出身  サイバー系企業でデータマイニングエンジニア職  創立記念日が3月18日  社長の出身地が福井県鯖江市  前職はバイオベンチャー  バイオマーカ探索してた  学生時代は枯草菌の研究 2011/11/26 2

    RのffとbigmemoryとRevoScaleRとを比較してみた
  • 統計言語 R の公式ヘルプでさらっと目を通しておくと良いトピックまとめ - ほくそ笑む

    『アート・オブ・Rプログラミング』の日語訳が出たので早速買いました。 細かい仕様の解説が多くちりばめられていて結構いい感じです。 プログラミング初心者向けではないですが、他の言語になじんでる人が R に入門したい場合には、他の入門書よりもこっちを読んだ方が手っ取り早いのではないかと思います。 例えば、下記のように、他言語との比較による解説が各所に見られます。 他のスクリプト言語の経験がある読者は、Python での None や Perl での undefined などの「存在しない」値を知っているかもしれません。実は、R にはこのような値が2つあります。NA と NULL です。 http://www.amazon.co.jp/gp/product/4873115795 さて、今日はこのの 1.7.4 節からの話題です。 統計言語 R には、公式ヘルプが付属しており、例えば平均値を計

    統計言語 R の公式ヘルプでさらっと目を通しておくと良いトピックまとめ - ほくそ笑む
  • http://r.livedocs.net/

  • 第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT

    今ほど統計解析が必要とされる時代はありません。オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しましょう! 読者にとってRは、世に溢れるデータの密林を切り開くための“ブッシュナイフ”となることでしょう(編集部) 統計解析の必要性とリテラシー 21世紀になって、経営学者の故ピーター・ドラッカー氏が言うところの知識労働者は、ますます統計解析を必要する局面が増えてきました。この状況は、20世紀後半から21世紀に起きた計算機能力の増大とインターネットの発展を基礎に、3つの大きな潮流が現れたことがキッカケとなっているように思います。その3つの潮流とは、オープンソース、オープンデータ、そしてオープンアイデアです。後ろの2つは今筆者が名付けました。 オープンソースは、皆さんがご存知のように、Linux、Apache、PerlPythonRubyなどのO

    第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT
  • 1