タグ

Rに関するtaro62のブックマーク (20)

  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • 機械学習アルゴリズムまとめ | 株式会社フルスピード - Growth Seed

    みなさんこんにちは。アナリストの荒木です。近い将来さまざまな仕事がロボットに置き換わっていくと多くの人が予想しており、そのコアテクノロジーの一つが機械学習です。GoogleがDeepMindを買収したことで機械学習という言葉も身近になりつつありますが、すでにamazonレコメンドや画像認識などで活躍しています。 そこで今回は、ウェブ担当者が「機械学習ってどんなことをやっているのだろう?」という場合に勉強できるスライドをまとめました。 ↓【無料DL】「SEO内部対策チェックシート」を無料ダウンロードする 機械学習によるデータ分析まわりのお話機械学習でどんなことをしているのかをまとめたスライドです。データのこと・機械学習のこと・評価のこと・分析のことの4部構成で、データマイニングの一連の流れを学ぶことができます。 Deep LearningGoogle認識例で有名になった手法を紹介したスラ

    機械学習アルゴリズムまとめ | 株式会社フルスピード - Growth Seed
  • Rでもlibsvmしたい! 第1話 - 油を売って怒りを買う.blog

    2012-12-29 Rでもlibsvmしたい! 第1話 はじめに Rでlibsvm使う時の自分用の設定と細かい話. とりあえず2クラス分類という前提で. 準備 ライブラリe1071を呼び出すだけ. これで一通りの関数が使えるようになる. install.packages("e1071") library(e1071) データを用意する とりあえずXは特徴量の行列, yは-1 or 1のラベルで用意. ラベルが数値じゃなくても大丈夫だけど, 自分が大抵この形式のcsvファイルで手元にデータを置いているのでそれに合わせて. X <- as.matrix(iris[51:150, -5]) y <- as.numeric(iris$Species[51:150]) y[y==2] <- -1 y[y==3] <- 1 学習させる とりあえず学習させる. # C-SVMなら result <-

    taro62
    taro62 2013/04/28
  • Rを使おう | R Financial & Marketing Library

    taro62
    taro62 2013/04/28
  • R でサポートベクターマシン - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですパッケージ † kernlabパッケージのksvm 関数 e1071 パッケージ predict.svm サポートベクターマシンのPredict メソッド svm サポートベクターマシン(Support Vector Machine) klaR ・・・ SVMlight 用 R インターフェース svmpath svcR パッケージ クラスタリングにサポートベクターマシンを利用 ↑

    taro62
    taro62 2013/04/28
  • RとRubyによるデータ解析入門

    人気の高いオープンソースのツール、RとRubyを使い、生データを処理し、シミュレーションし、仮説を立て、統計的手法を用いて検証する、というデータ解析の基の理解を促します。基が学べるだけでなく、自分のメールボックスや自分の心臓の鼓動など身近な題材を対象としており、データサイエンスの醍醐味を味わうことができる一冊です。日語版ではさまざまな統計分析手法についての入門となる章を追加。こので使っている統計の基礎も学べる構成になっています。プログラマ視点で書かれた書は、ビッグデータを活用するためのスキルを身に付ける必要に迫られた多くの開発者にとっても貴重な情報源となるでしょう。 関連ファイル サンプルコード 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すで

    RとRubyによるデータ解析入門
  • 第7回 t検定による問題解決、Rで実践できますか?~データサイエンティストの統計学─倉橋一成からの問題 | gihyo.jp

    エンジニアのスキルを試すコードパズル ─この問題、あなたは解けますか? 第7回t検定による問題解決⁠⁠、Rで実践できますか? ~データサイエンティストの統計学─倉橋一成からの問題 問題 10万人の集団A、B、Cの群があります。これらの集団の身長の「平均値」が等しいか等しくないか、全員の身長を測定せずに判断したいと思います。それぞれの集団から100人ずつサンプリングしてt検定したらどうなるか、Rで計算してみましょう。 準備として、以下のコードを実行し、10万人分の身長データを3群作成してください。それぞれの群は以下のように想定しています。 A群とB群⇒ 平均値が170cmの集団 C群⇒ 平均値が175cmの集団 # A群のデータ生成 set.seed(1) heightA <- 170 + 10*rnorm(100000) # B群のデータ生成 set.seed(2) heightB <-

    第7回 t検定による問題解決、Rで実践できますか?~データサイエンティストの統計学─倉橋一成からの問題 | gihyo.jp
  • はじめての「R」

    The document describes various probability distributions that can arise from combining Bernoulli random variables. It shows how a binomial distribution emerges from summing Bernoulli random variables, and how Poisson, normal, chi-squared, exponential, gamma, and inverse gamma distributions can approximate the binomial as the number of Bernoulli trials increases. Code examples in R are provided to

    はじめての「R」
  • 統計処理ソフト R 入門 講習会資料

    講習会の目的 講習会は, R についての自習の基盤をつくることを目指します。 たとえ初心者向けの数時間の入門講習でなく1年間の毎週の演習授業であっても,R に関してすべてを説明するのは不可能だと思われます。 R の世界は,縦にはそこそこ深く,横には果てが見えないほど広いです。 CRAN に登録されている R のパッケージは 1000 を超えました。 よって,受講者の幅も広いことですし,受講者各自にとってぴったりな統計解析の実用的な解説をするのはあきらめて, 各自が必要に応じて情報を探し,見つけたものを難なく活用できるようになること,を目標にしました。 ここに自分の求めている分析手法や作図法などの答えがあるとは期待しないで下さい。それは帰ってからのあなたの楽しい仕事です。 R の利用と R 言語 R の根幹は R 言語のインタプリタであり,ユーザはR言語を駆使することでRを操作します。 S

  • R言語でSVM(Support Vector Machine)による分類学習 - Y's note

    サポートベクターマシン入門 作者: ネロクリスティアニーニ,ジョンショー‐テイラー,Nello Cristianini,John Shawe‐Taylor,大北剛出版社/メーカー: 共立出版発売日: 2005/03メディア: 単行購入: 8人 クリック: 135回この商品を含むブログ (41件) を見る SVMとは Support Vector Machineの略で教師あり学習に分類されます。線形、非線形の識別関数があり現在知られている多くの学習モデルの中では最も優れた識別能力があるとされています。いわゆる2値分類を解くための学習モデルであり、線形しきい素子を用いて分類器を構成します。訓練データにおける各データ点と距離が最大になるマージン最大化という基準で線形しきい素子のパラメータを学習させます。シンプルな例は与えられたデータ集合を全て線形に分離する事です。SVMはカーネルトリックという

    R言語でSVM(Support Vector Machine)による分類学習 - Y's note
  • atword.jp - このウェブサイトは販売用です! -  リソースおよび情報

    このウェブサイトは販売用です! atword.jp は、あなたがお探しの情報の全ての最新かつ最適なソースです。一般トピックからここから検索できる内容は、atword.jpが全てとなります。あなたがお探しの内容が見つかることを願っています!

  • JIN'S PAGE

    R、R言語、R環境・・・・・・ Rのダウンロードとインストール リンク集 題名 Chap_01 データ解析・マイニングとR言語 Chap_02 Rでのデータの入出力 Chap_03 Rでのデータの編集と演算 Chap_04 Rと基統計量 Chap_05 Rでの関数オブジェクト Chap_06 Rでのデータの視覚化(1) Chap_07 Rでのデータの視覚化(2) Chap_08 Rでのデータの視覚化(3) Chap_09 GGobiとデータの視覚化(Rgobi) Chap_10 Rと確率分布 Chap_11 Rと推定 Chap_12 Rと検定 Chap_13 Rと分散分析 Chap_14 Rと回帰分析 Chap_15 Rと重回帰分析 Chap_16 Rと一般化線形モデル Chap_17 Rと非線形モデル Chap_18 Rと判別分析 Chap_19 Rと樹木モデル Chap_20 WEK

  • 統計処理ソフトウェアRについてのTips

    最終更新:2022年 11月 3日 (木曜日) このページでは,国際共同研究のオープンソースなプロジェクトで開発され,GNU GPLに従って公開,配布されている高機能な統計ソフトであるRについてのTipsを扱う。 Archives 保管庫インデックス 保管庫1(2004年1月まで) | 保管庫2(2010年6月まで) | 保管庫3(2014年5月まで) | 保管庫4(2015年6月まで) | 保管庫5(2015年12月まで) | 保管庫6(2016年12月まで) | 保管庫7(2019年12月まで) | 保管庫8(2020年1月から) 無料電子 出版社の和書刊行方針変更により絶版になったので,その時点での最終版をpdfで無料公開している。中澤 港(2003)『Rによる統計解析の基礎』ピアソン・エデュケーション(virtual 9th ed.)と中澤 港(2007)『Rによる保健医療データ

  • 第21回Tokyo.Rを開催しました! - yokkunsの日記

    2012/3/10に、第21回Tokyo.Rを開催しました! http://atnd.org/events/24811 @aad34210: 続・はじめてのR (30分) Tokyo r21 2 View more PowerPoint from aad34210 R言語の初心者向けの発表。 プログラミングの基である条件分岐とループから、 R言語の基機能であるグラフ作成、そして統計解析という盛り沢山な内容でした! @holidayworking: Rによるデータサイエンス第16章 集団学習 (30分) アンサンブル学習 View more presentations from Hidekazu Tanaka アンサンブル学習のアルゴリズムをcaretパッケージを使って比較 バギング ブースティング ランダムフォレスト ⇒ ランダムフォレストが1番精度が高かった! @Hiro_macch

    第21回Tokyo.Rを開催しました! - yokkunsの日記
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
  • 第16回R勉強会@東京(#TokyoR)を開催しました! - yokkunsの日記

    第16回R勉強会@東京(Tokyo.R#16)を開催しました! 第16回R勉強会@東京(Tokyo.R#16) : ATND 内容 @sleipnir002:Rで学ぶデータサイエンス5パターン認識 8,9k-近傍法、学習ベクトル量子化 概要:教科書の内容にそって、上記のアルゴリズムの勉強をします。 パターン認識 08 09 k-近傍法 lvq View more presentations from sleipnir002 @Hiro_macchan : Rを用いた地理的情報解析 概要:Rを用いた地理的情報の解析について、RにもGISにも詳しくない人間ががんばった経緯を発表できればと思います。 @a_bicky: Rデバッグあれこれ 概要: 実用的なデバッグ方法を紹介できればと思います。 Rデバッグあれこれ View more presentations from abicky @ito_

    第16回R勉強会@東京(#TokyoR)を開催しました! - yokkunsの日記
  • JIN'S PAGE

    R、R言語、R環境・・・・・・ Rのダウンロードとインストール リンク集 題名 Chap_01 データ解析・マイニングとR言語 Chap_02 Rでのデータの入出力 Chap_03 Rでのデータの編集と演算 Chap_04 Rと基統計量 Chap_05 Rでの関数オブジェクト Chap_06 Rでのデータの視覚化(1) Chap_07 Rでのデータの視覚化(2) Chap_08 Rでのデータの視覚化(3) Chap_09 GGobiとデータの視覚化(Rgobi) Chap_10 Rと確率分布 Chap_11 Rと推定 Chap_12 Rと検定 Chap_13 Rと分散分析 Chap_14 Rと回帰分析 Chap_15 Rと重回帰分析 Chap_16 Rと一般化線形モデル Chap_17 Rと非線形モデル Chap_18 Rと判別分析 Chap_19 Rと樹木モデル Chap_20 WEK

  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

  • R のセットアップ+ R 入門

    R のセットアップ方法と R の基操作を下記スライドにまとめております. - R に関する資料・統数研の公開講座「 R で学ぶデータ解析とシミュレーション」1 日目の資料 - 日時:5月19日(月)〜20日(火)10時〜16時 (10時間) 講師:舟尾暢男(武田薬品工業(株)),熊谷悦生(大阪大学大学院) 内容:フリーな統計処理ソフトである R を使っての格的なデータ解析やシミュレーションを行なうための第一歩として R の基的な使用方法から始まり自分で関数を作り,簡単なシミュレーションを行なう段階まで演習を含みながらの解説を行なった後,様々なデータに対して R によるデータ解析を実施し,それに関するシミュレーションを示す.講座は R によるデータ解析の入門講座であるため,なるべく統計の基礎知識を前提としないように講義をすすめるが,初等的な数学知識(微積分や行列代数の知識)および基

  • 1