[B! データ][r] h1saoのブックマーク

h1sao id:h1sao

データとrに関するh1saoのブックマーク (17)

Spotifyの76,000曲の属性データを分析した結果、J-RockはRockというよりむしろPunkだった
Do you want to subscribe to the notification em ail? Once subscribed, notification em ails will be sent to your registered em ail address when the insight is republished or refreshed by the scheduling.
h1sao 2018/07/02
spotify

データ

分析

R

programming

プログラミング
リンク
データフレームの特徴をもっと早く掴みたい ~ ハドリーへの挑戦 - cucumber flesh
探索的なデータ分析 (Explore Data Analysis: EDA)を行う際は、データの要約や欠損の有無の確認、可視化が欠かせない作業となります。特に可視化は、データのもつ性質や関係を表現するのに大変役立ちます。一方で、可視化に用いた図はコードとは別に保存する必要があったり、作図のためのコードを書いたりと、面倒な側面もあります。 … きちんとした作図は面倒だけどデータの性質や欠損について把握したい。そんな時にはコンソール上での可視化を試しましょう。そのためのパッケージをHadley Wickhamが開発しています。 https://github.com/hadley/precis Rにはそもそも、オブジェクトの情報を要約してくれるsummary()関数があるのですが、この precisパッケージは、それを置き換えるような設計を目指しているそうです。早速使ってみましょう。 # gi
h1sao 2017/08/10
R

データフレーム

データ

あとで読む
リンク
【R】転職ドラフトのデータをスクレイピングして分析（集計）する - 歩いたら休め
お久しぶりです。最近上司と「機械学習とかその辺の技術が発展したら、真っ先に自動化されて仕事なくなるのはハンパなエンジニアと中間管理職だよね〜」という話をして危機感を募らせている @takeshi0406 です。 WEBエンジニアにはご存じの方も多いと思いますが、転職ドラフトというWEBサービスがあります。 job-draft.jp このサービスは、次のような理念や問題感から始まった作られたものだそうです。素晴らしいです。企業による公開競争入札。これなら、自由競争でのリアルな相対価値がわかるようになる。エンジニアだからこそ、より明確に。誰が評価され、誰が評価されないのか。自分の価値向上には、これから何をすべきなのか。私も「友達を紹介してオライリー・ジャパンの本をGETしよう！」の文言につられて、友だちを3人紹介した上で登録したのですが、レジュメを丁寧に読んでダメ出ししてもらえ（
h1sao 2017/04/24
あとで読む

r

スクレイピング

データ分析

データ
リンク
Ｒのアソシエーション分析結果をGephiでネットワーク描画（２）（support値をノードのサイズに、lift値をノードの配色に） - Qiita
スクリプトの実行結果（Gephi 出力グラフ）【ノードの大きさ】アソシエーション分析結果のlift値の大きいほど（ノードも）大きい【ノードの色】（アソシエーション分析結果の）support値が大きいほど、緑色の成分が濃い（※RGB値のうち、赤と青の要素は全ノード同じ値を設定）１. アソシエーション分析を実行関数： arules 関数： arulesViz データ：組み込みデータセット Income を用いる Income　：米国サンフランシスコ・Bayエリア 9,409人の個人プロファイル（属性）・収入アンケート調査結果
h1sao 2015/11/09
R

アソシエーション分析

データ
リンク
{igraph} カレーなるネットワーク解析 - Qiita
0. イントロ男女19人でカレーを食べに行きました。「Bセット」は、7種類の中から2種類のカレーを選びます。重複してはいけません。肉カレー野菜カレーその他
h1sao 2015/11/04
R

解析

データ
リンク
［R］SQLクエリでRのデータを加工・集計できるパッケージ「sqldf」 - データ分析がしたい
私が分析を行う際、データ加工や集計作業は基本的にSQLで行い、分析やモデル作成はRで行うことが多いです。しかし、DBが使えないような場合やちょっとした集計などRでデータを加工・集計したい場合があります。 RでSQLで行うようなデータ加工・集計を行うには、基本的にsubsetやorder、merge、aggregateといった関数を利用します。（SQLとRの関係については、以下のページがわかりやすいです。 http://d.hatena.ne.jp/a_bicky/20110529/1306667230）ただ、こういった関数はよく使い方を忘れてしまい、Webなりヘルプなりを使うたびに調べるなんてことが起こります。正直、かなり面倒なわけです。そこでSQLクエリを使って直接Rのデータを加工できたら良いなーと思うわけですが、「sqldf」パッケージを用いれば直接SQLを利用してデータを
h1sao 2015/09/16
R

データ分析

sql

データ
リンク
A/B テストで施策の効果を検証！エンジニアのための R 入門 - クックパッド開発者ブログ
こんにちは、買物情報事業部でサーバサイドの開発を担当している荒引 (@a_bicky) です。今回のエントリでは R で A/B テストの結果検証を行う方法の一例について紹介します。エンジニアでも自分の関わった施策の効果検証のために簡単な分析をすることがあるかと思いますが、そんな時にこのエントリが役立てば幸いです。なお、次のような方は対象外です。 A/B テストや KPI の設計に興味のある方この辺には全く触れませんプログラミング初心者わからない単語が大量に出てくるでしょう R で統計学や機械学習の手法をバリバリ使いたい方世の中の “分析” の多くは集計処理がメインです Python, Julia など既に分析する上で使い慣れた言語・ツールがある方今回のエントリ程度の内容であればわざわざ乗り換える必要もないでしょう OS は Mac を前提として説明するので、Windows
h1sao 2015/05/08
R

データ

data

分析
リンク
Rプログラム (TAKENAKA's Web Page)
この文書の最終的な目標は，いくつものデータセットを一括処理するためのプログラムを書くことですが，そのまえに，ひとつのデータファイルを読み込んでの処理をごくごく簡単に練習してみます．練習用ディレクトリとデータファイルの用意すでに前のページの練習のためにディレクトリは作ってあるかもしれません．それならそれを使いましょう．まだ作ってないなら，さっそく用意してください．名前はなんでもけっこうです．そのディレクトリの中に，最初に使う練習用データ len_width.txt を入れます．＞データファイル len_width.txt クリックするとそのまま内容が表示される場合，全体をコピーしてからエディタの新規文書に貼りつけるとか，「対象をファイルに保存」「リンク先を保存」（ブラウザによる）というようなメニュー項目を選ぶとかしてみてください．このファイルに，以下のように３列のデータ
h1sao 2015/03/12
R

データフレーム

データ
リンク
cyREST入門～RとCytoscapeのAPI連携～
NeRF-VAE is a 3D scene generative model that combines Neural Radiance Fields (NeRF) and Generative Query Networks (GQN) with a variational autoencoder (VAE). It uses a NeRF decoder to generate novel views conditioned on a latent code. An encoder extracts latent codes from input views. During training, it maximizes the evidence lower bound to learn the latent space of scenes and allow for novel vie
h1sao 2015/02/21
R

Cytoscape

データ

データ分析
リンク
knitr ではじめるデータ分析レポート作成 ~基礎編~ - Qiita
対象読者 knitr でのドキュメント生成は体験済みの方データ分析をやっていてそのレポートを Word などで作るのが面倒くさい方チームで分析をやっていて，データ分析の再現性を共有したい方記事のゴールゴール：knitr を基本的に使えるような知識を身に付けて，R での分析結果を HTML として生成できるようになる前提 RStudio をインストール済み knitr をはじめるにあたっての基礎知識 knitr とは？ knitr パッケージは．R の実行結果をレポートして作成するのに役立つパッケージです．組織でのデータ分析には，報告書を作成する業務がつきまといます．たとえば，Word で報告書を作成していてデータ分析結果のプロット図を何百枚も貼り付けているとします．その途中で分析に誤りがあったり，条件を変更したりするときに，もう一度画像を貼り直す作業をするのは大変です． k
h1sao 2015/02/17
データ分析

レポート

分析

データ

R
リンク
統計・データ解析
『Rで楽しむ統計』が出ました。サポートページ『Rで楽しむベイズ統計入門』が出ました。サポートページ，第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE（教育用標準データセット）も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが，本サイトの古い記事ではそうなっていないところがあるかもしれません（read.csv() などで as.is=TRUE は不要になります（あってもかまいませんが））。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8"，"UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS（CP932）データの場
h1sao 2015/02/13
データ

R

統計
リンク
Rによるアソシエーション分析 - Qiita
相関ルール頻出するアイテム間の何らかの組み合わせの規則をアソシエーションルールと呼ぶ。アソシエーションルールは連関ルール、関連ルール、相関ルールなどと呼ばれます。「商品Aを買うと商品Ｂも買う」のようなルールを見つけ出すことを目標としています。今回の例は、掃除機の購買動機に繋がる不満要素の組み合わせです。これを特定し、その中でも特に強い不満点を解明して、商品開発に貢献させることを目標とします。アンケートの設問設問の形式チェックボックス系の複数回答形式の設問回答データ水平展開形式のデータサンプル毎に複数の設問への回答が存在し、１サンプル１レコードの形式であること。集計データ予め用意できるのであれば、SQLなどで集計データを作成しておくとグラフが描きやすくなります。（※そこまで準備しなくとも、Rで図を出すことは可能です。） ※しかし、この表では集計されてしまっているので
h1sao 2014/12/24
R

アソシエーション分析

データ
リンク
Rでスポーツデータ解析がしたい: 千秋楽での勝率 - 300億円欲しい
はじめに前回, 大相撲のデータを正しく作るのが辛い, ということを書きました. Rでスポーツデータ解析がしたい: データを作るのって大変ですね - 300億円欲しいまだ整形できていないのですが, 現段階で可能な解析をしたいと思います. 八百長問題が気になりますので, 千秋楽の勝率を集計してみます. 先行研究大相撲のアノーマリー. 2010年に書かれた記事です. 八百長がありそうかどうか, という解析です. 実践！ Rで学ぶ統計解析の基礎（8）：大相撲のアノーマリー（2） (2/2) - ＠IT もしも、この計算の追試や、何らかの追加計算をされた方がいらっしゃったら、是非ともその結果を教えてくださることを熱望します。また、1999年以前10年間程度の十両・幕内の勝敗データを持っていらっしゃる方がおりましたら、そのデータを提供いただければ、より一層踏み込んだことが分析できると思います
h1sao 2014/12/12
R

分析

解析

データ
リンク
Rの実践！エンジニア向けデータマイニング講座｜freee 坂本登史文【機械学習・決定木理論の活用編】 | キャリアハック（CAREER HACK）
統計解析ツールRを使ったエンジニア向けデータマイニング講座後編。機械学習の1手法である決定木を用いて、事例を基にデータマイニングを実践していきます。エンジニアとしてのキャリアアップを考えている方にピッタリのデータマイニング連載企画最終回です。ここまでのあらすじ「山田とデータマイニングとR」前回は、ウェブ系のエンジニアの山田君がデータマイニングを始めるきっかけをお話ししました。 ―Rを学ぼう！エンジニア向けデータマイニング講座｜freee 坂本登史文【初めの第一歩編】無事にRとMySQLを接続し、うまくヒストグラムを描くことができました。今回は、山田君がデータマイニングを始めるきっかけとなった「どのような属性のユーザーが課金をしてくださっているのか」ということを、機械学習の1手法である、「決定木」という手法で明らかにしていきたいと思います。さて、山田君はうまくデータを分析して、サー
h1sao 2014/10/16
データマイニング

データ

分析

MySQL

R

データ分析
リンク
統計を始める方へ①_データ環境Rの基本的なプログラミング｜データアーティスト
Rは統計をするうえでとても使い勝手の良いプログラミング言語です。本スライドでは、データの型の説明から、集計までに基本的なプログラミング方法を説明します。会社サイト：http://www.data-artist.com/Read less
h1sao 2014/05/08
データ

統計

R

tips
リンク
IBM Developer
IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.
h1sao 2013/07/05
R

データ

統計
リンク
統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
はじめに統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。それでは実際のデータをどうやって手に入れましょうか？実験や調査をして実際のデータを得るのは大変でお金もかかります。幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。というわけで、今日は、
h1sao 2012/02/14
データ

まとめ

統計学

R

勉強

統計
リンク
1