タグ

Rに関するm-kawatoのブックマーク (11)

  • Amazon.co.jp: ネットワーク分析 (Rで学ぶデータサイエンス 8): 鈴木努 (著), 金明哲 (編集): 本

    Amazon.co.jp: ネットワーク分析 (Rで学ぶデータサイエンス 8): 鈴木努 (著), 金明哲 (編集): 本
  • RとRubyによるデータ解析入門

    人気の高いオープンソースのツール、RとRubyを使い、生データを処理し、シミュレーションし、仮説を立て、統計的手法を用いて検証する、というデータ解析の基の理解を促します。基が学べるだけでなく、自分のメールボックスや自分の心臓の鼓動など身近な題材を対象としており、データサイエンスの醍醐味を味わうことができる一冊です。日語版ではさまざまな統計分析手法についての入門となる章を追加。こので使っている統計の基礎も学べる構成になっています。プログラマ視点で書かれた書は、ビッグデータを活用するためのスキルを身に付ける必要に迫られた多くの開発者にとっても貴重な情報源となるでしょう。 関連ファイル サンプルコード 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すで

    RとRubyによるデータ解析入門
  • インターリュード: TwitterとR

    今回はTwitterという身近な題材を使って、Rによるデータ収集と可視化をやってみます。Rの豊富なライブラリを使えば意外に手軽にできます。 今回は間奏的にIT寄りの話題を この連載は@ITの連載でもかなり毛色の違う内容です。それにもかかわらず前回までの4回は、統計的検定をいきなり導入したり、日政府や世界銀行の経済統計にアクセスしてみたり、さらにはWikiLeaksの暴露データを統計解析してみたりと、かなりハードコアな内容に走ってしまいました。 第4回の「あとがき」では同じ路線で突っ走ろうということを申し上げていたのですが、今回は間奏(インタリュード)として、より@ITらしく、IT寄りの話題を取り上げたいと思います。 TwitterとR Twitterの人気は世界的にまだまだ続いているようです。2010年8月後半に発表された2010年6月分の統計によれば、現在はインドネシアやブラジル、ベネ

    インターリュード: TwitterとR
  • 第1回R勉強会@東京 開催しました - yokkunsの日記

    ちょっと遅くなってしまいましたが、無事、第1回R勉強会@東京を開催しました。 第1回R勉強会@東京 : ATND 今回初めての主催だったんですが、まさかRの勉強会で満員以上になるとは思ってなかったのでびっくりしました。 自分が気に入った言語とかソフトウェアが、こんなに使ってる人or これからやっていきたいと思っている人がいっぱいいるのはうれしいですね。 発表資料 資料はGoogleグループとSlideshareにアップしました。 第1回R勉強会@東京View more presentations from yokkuns. 何か不明なとこや、おかしいところがあったらご指摘ください。 反省点 反省すべきところは、多々あると思いますが、今回は何より範囲が広すぎました(自分にとって)。 後半の推測統計のあたりから資料も理解も追いついていなくて、ちょっとグタグタになってしまいました。。。 次回以降

    第1回R勉強会@東京 開催しました - yokkunsの日記
  • Tsukuba.R#5の発表資料 - yasuhisa's blog

    Rの基データ構造をもっと理解しよう id:syou6162 自己紹介 吉田康久 id:syou6162 syouでおk Tsukuba大学のM1 Tsukuba.Rの近況(?)その1 Tsukuba.Rの活動が熊でも知られているみたいで、ちょっと発表してきた やっちろ.Rの発表資料 - Seeking for my unique color. Tsukuba.Rの近況(?)その2 RubyKaigiにスタッフとして参加 クレジットのところにTsukuba.R id:wakuteka、id:mickey24、id:negaton、id:syou6162 今回の内容 基に戻って、Rで重要なデータ構造のおさらいをしよう 前回(#4)はCでの拡張とかだったので。。。 データ構造とそれに関連する便利な関数を絡めて紹介 慣れている人にも何か新しい発見があるように 話の中でいくつかのパッケージを軽

    m-kawato
    m-kawato 2009/06/14
    "Rの基本データ構造をもっと理解しよう"
  • 共立出版株式会社 新シリーズ・講座 「Rで学ぶデータサイエンス」

    ●刊行の趣旨 データサイエンスは,理論だけではなく,実際のデータを操作・解析・マイニングを行わなければならない。そのためには,基礎理論を理解し,その理論に基づいてツールを用いて実現しなければならない。そのツールとして近年フリーであるRが急速に普及している。Rには,すでに数千のフリーパッケージが公開されている。また,Rに関する訳書・和書は20冊を超えているが,初級レベルのものがほとんどである。また,データサイエンスは,理工系だけではなく,非理工系や多くの専門分野で用いるようになっている。非理数系の人の中には,数理的な基礎が弱く,直接厳密な数理理論からデータサイエンスに入門するのが困難である方がほとんどである。そのような方々にとっては,実践的に入門を行い,数理理論を徐々に理解するのも一つの方法である。数理に強い方,弱い方などに関係なく幅広く,長く利用できるを提供することがシリーズを企画す

  • Tsukuba.R#4の感想とコミュニティ活動のありかたについて - yasuhisa's blog

    大分遅くなってしまいましたが、Tsukuba.R#4の感想etcについて上げていきたいと思います。 発表に関して Tsukuba.R史上最大に参加者数*1だったということもあり、発表も多種多様な感じでした。 「Rをなんとな理論で使ってみた」というような発表もあったり Perlと比較して、Rはこういうところが足りないんじゃないか、というような指摘のLTがあったり Brainf*ckがついに登場したり 10/30が発表ということで非常に活発な感じでした。発表者の皆さんありがとうございました!! 自分の発表 発表資料はここに上げてあります。"高速化"という結構マニアックな内容を話すということでR初心者の人を置いていってしまうかも、という懸念があったので ところどころにRの基データ型の説明も入れてみた data.frame、matrix、listなど あの説明では恐らく不十分だと思うので、もっと

    Tsukuba.R#4の感想とコミュニティ活動のありかたについて - yasuhisa's blog
  • Tsukuba.R#4での発表資料 - yasuhisa's blog

    上げておきます。 Rを高速化するための10の方法 id:syou6162 自己紹介 吉田康久 id:syou6162 syouでおk Tsukuba大学の4年生 最近の出来事 卒研おわた ノンパラメトリック回帰 自分でRのパッケージを作ってみた 初めて!! 漢ならコードで語れ、ということで自分のパッケージを作った - Seeking for my unique color. Google summer of code Rのプロジェクトがあるので応募しようと思っている ここから題 Rを高速化するための10の方法 注意 割とアドバンスな内容を話すかも だけど、R初心者の人にも役に立つような話も折り混ぜていくので聞いてやってくだしあ>< きっかけ 卒論が理論&シミュレーション Macbookをがんがん回す まともに回すと3日かかる>< 3つのステップ Rレベルでの高速化 Cレベルを使った高速化

    Tsukuba.R#4での発表資料 - yasuhisa's blog
    m-kawato
    m-kawato 2009/03/02
  • twitter's social network analysis

    The document discusses analyzing the community structure of a Twitter social network with 329 users and 75 topics. It proposes using the favorite function and weighted reciprocal of favorites between users to cluster the network into communities. It describes implementing the analysis in R using the igraph package and discusses that calculating communities for the whole network of 5000 users would

    twitter's social network analysis
  • CでRの拡張したら速すぎて(40〜50倍)吹いたwww - yasuhisa's blog

    昨日Gibbs Sampler Algorithmをやってみたわけだが、Rの中でfor文を書いていて必要となるサンプル数が多くなると非常につらくなってくることは目に見えている。しかも、MCMCでは初期値依存となる期間のサンプルを捨てないといけない。そういうわけでじゃんじゃんサンプルを作っても大丈夫なような速度が必要。 Rで速度を上げようと思ったらapplyファミリーを使うとかベクトル単位での処理をするetcが常套手段*1。が、今回は質的にfor文が必要なケースである。 で、困るわけだがRにはC、C++、fortranを使って拡張する機能がある。詳しくはこの辺に載っている。そういうわけでCのポインタもアドレスも理解していないid:syou6162がRが好きすぎたためにCを書いてみたという感じの内容。 #include <R.h> #include <Rinternals.h> SEXP r

    CでRの拡張したら速すぎて(40〜50倍)吹いたwww - yasuhisa's blog
  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

  • 1