2019年5月6日のブックマーク (11件)

  • R言語dplyr::distinctで簡単に重複行を削除できる。キー項目以外の項目も簡単に抽出。 - 一所懸命に手抜きする

    SQLの select distinct では指定した列をキーにして重複のないデータを取得できます。 重複する行を削除するSELECT DISTINCT - 一所懸命に手抜きする 重複行削除の際、重複判定に指定したキー列項目以外の列も取得するSQL - 一所懸命に手抜きする R言語でも同様のことができるのは既に書きました。 R言語のuniqueや!duplicated で重複のないデータを取り出す - 一所懸命に手抜きする dplyrパッケージを使うと、もっと簡単に実現できます。 Sampleデータ作成 当ブロクで使うサンプルデータを作成するコード保管庫|R|一所懸命に手抜きする[忍者] に掲載したサンプル作成コードを実行すると サンプルテーブル buyList 入荷日付 商品番号 商品名 当社原価 相手原価 20170102 12345 XA-55 3500 3500 20170103

    R言語dplyr::distinctで簡単に重複行を削除できる。キー項目以外の項目も簡単に抽出。 - 一所懸命に手抜きする
    silovar
    silovar 2019/05/06
  • scratch-R: frequencies

    度数とクロス集計 カテゴリカル変数のクロス集計表 (分割表) 、独立性の検定、連関、グラフ化について説明する。 度数表をつくる 度数表 (frequency table, 分割表/contingency table 、クロス集計表/cross-tab ともいう) を作成する方法はいくつかある。以下にその例を示す。また、青木先生のfrequency 関数も便利。 table 関数 table( ) 関数で度数表が作成できる。割合を算出したいときはe prop.table( ) 関数, 合計欄には margin.table( ) 関数が使える。 # 2元の度数表 mytable <- table(gear=mtcars$gear, carb=mtcars$carb) # "gear=..."としないと名前のない表になるので見づらい。 mytable # 集計欄 margin.table(myt

    silovar
    silovar 2019/05/06
  • table 関数を使ったクロス集計 | R | Kengo Nagashima - Keio University

    R の base には、クロス集計を行うための table 関数があります。 ページでは、table 関数を用いた一般的な作表、割合の計算方法、およびパーセント表示についてまとめたいと思います。 table 関数の基的な使い方は、関数の引数に集計対象の変数を与えるだけです。 層別変数を z とし、変数 x, y に対するクロス集計を行う場合は、 set.seed(20120508) x <- sample(letters[1:3], 300, replace = T) y <- sample(letters[4:5], 300, replace = T) z <- sample(letters[6:7], 300, replace = T) t1 <- table(z, x, y) ftable(t1) を実行します。実行結果は以下の様になります。 > ftable(t1) y d e

    silovar
    silovar 2019/05/06
  • lubridateで年齢計算(Excelのアレ) - データ穴リストのブログ

    lubridateーーそれは愛しい、時間概念とのアバンチュール 今宵のステキな刻(とき)を彩る、珠玉のLovely date..... …と、外で書いててかなり恥ずかしい。 ■今回はlubridateパッケージについてです。 lubridate、とても便利!という声は聞きつつも、あんまり他のブログに書かれてないんだもの。 他の記事といえば以下のあたりを参考にさせていただきました。 estrellita.hatenablog.com www.karada-good.net この辺りのブログはもうアレですね。 私にとっての貴重な情報源です。 もうホント、毎日のように仕事もしないで参考にさせていただいてます! ■そうなんだけど だけど、そこから先の、日付データの、次の処理がない。 会員情報とか扱ってるようなお仕事をしてる方だったら、生年月日とか持ってますよね? 年齢とか計算したくないですか……!

    lubridateで年齢計算(Excelのアレ) - データ穴リストのブログ
    silovar
    silovar 2019/05/06
  • 【R】日付から曜日を簡単に取得する方法

    R ( 57 ) トレジャーデータ ( 43 ) Treasure Data ( 27 ) データ処理 ( 24 ) SQL ( 23 ) dplyr ( 20 ) presto ( 12 ) 動画 ( 12 ) BigQuery ( 11 ) 音楽 ( 7 ) データ抽出 ( 6 ) データ集計 ( 6 ) THEO ( 5 ) data.table ( 5 ) filter ( 5 ) セミナー ( 5 ) テオ ( 5 ) 投資 ( 5 ) 研究 ( 5 ) 統計 ( 5 ) Google ( 4 ) Google Spreadsheet ( 4 ) rbind ( 4 ) まとめ ( 4 ) クロス集計 ( 4 ) ビッグクエリ ( 4 ) 作図 ( 4 ) 大規模データ ( 4 ) 日時 ( 4 ) Big Query ( 3 ) Error ( 3 ) RStudio ( 3

    【R】日付から曜日を簡単に取得する方法
    silovar
    silovar 2019/05/06
  • Rで文字列を日付時刻型に変換する

    日付時刻と観測値が対応付いたデータってありますよね。例えば、原子力規制委員会が公開している放射線モニタリング情報だと下記のようなCSV形式で、測定時刻と測定値が対応付いています。 V5, V6 2014/12/26 23:50, 0.033 2014/12/26 23:40, 0.034 2014/12/26 23:30, 0.033 ................, ..... こういうデータを見ると、V5を横軸、V6を縦軸にして時系列グラフを描きたくなりますよね。でも、V5が文字列型で読み込まれていると、そのままplotのx軸に指定してもうまくいきません。 日付や時刻を表現する型に変換してやる必要があります。 上記のような書式(日付がスラッシュ、時刻がコロン)ならば、POSIXlt関数に引数で渡すだけで、簡単に変換することができます。 > as.POSIXlt("2014/12/26

    silovar
    silovar 2019/05/06
    “d$日付時刻 <- as.POSIXlt(d$V5)”
  • R言語で年齢や月齢を計算する。 - Qiita

    目的 R言語で年齢や月齢を計算する。 (年単位や月単位で2つの日付差を計算する) 方法 (生年月日を1981/07/05とした場合) 年齢を求める

    R言語で年齢や月齢を計算する。 - Qiita
    silovar
    silovar 2019/05/06
    “length(seq(as.Date("1981/07/05"), Sys.Date(), "year"))-1”
  • R言語の便利なコマンド集 | AVILEN AI Trend

    R言語では、当に便利なコマンドがいくつもあります。頑張れば、知らなくても解析は出来たりしますが、知っておくと解析がはるかに楽になる、というような類のものになっております。ただし、一度に全部覚えるようなものではなく、実際に解析を行っているうちに徐々に覚えるというようなものです。 なので、今回は「へえ~こんなコマンドもあるんだ~。便利だね~」っていうようなスタンスで、ご自身のパソコンで軽くプログラムを流しながら読んでもらえればと思います。

    R言語の便利なコマンド集 | AVILEN AI Trend
    silovar
    silovar 2019/05/06
  • 1万人以上「集客」するイベントを実現するためにやっている20のこと。|佐藤奨 / TSUTOMU SATO !|note

    こんにちは。佐藤奨(さとうつとむ)です。 「アクティブキッズフェスタ」という子供向けのスポーツ・アウトドアイベントを東京有明で年2回ペースで開催しています。このイベントは2014年の秋に第1回目を開催し、そこから春秋と年2回のペースで実施していて2019年4月で第10回目の開催となります。 来場者は、東京、千葉、神奈川、埼玉の一都三県からが多いものの、第9回のイベントでは、北は北海道、南は沖縄からを含め25都道府県に加え、タイのバンコクから来場していただく方などもいました。 私は、このイベントの企画準備から運営まで全てに関与する実行委員長として動いており、最初のイベントの立ち上げやコンセプト設計から企画してます。 2019年10月27日、28日の開催では、2日間で過去最多の13,530名の来場者を集めるなど、ファミリーを集客できるイベントに育ってきました。 また、これまでに15箇所を超える

    1万人以上「集客」するイベントを実現するためにやっている20のこと。|佐藤奨 / TSUTOMU SATO !|note
  • dplyrを使いこなす!JOIN編 - Qiita

    はじめに 今回は、複数(主に2つ)のdata.frameを結合する方法についてまとめます。 実際に分析する際に、1つのdata.frameだけで完結することはあんまりなく、マスタデータの結合など複数のdata.frameを組み合わせて使う必要がありますが、またまたdplyrを使えば簡単にできます。 結合と言っても、結構色んな方法があるので、分かりやすいようにチートシートからイメージ図を拝借してきました。 1つのdata.frameを操作する場合は、↓の記事を参照してください。 dplyrを使いこなす!基礎編 dplyrを使いこなす!Window関数編 JOINの種類 JOINの種類は大きく分けて以下の3つあります。 種類 説明

    dplyrを使いこなす!JOIN編 - Qiita
    silovar
    silovar 2019/05/06
  • R:list.filesによるファイルパス取得あれこれ。 - Qiita

    list.filesによるファイルパスの取得方法いろいろです。 ファイル件数が増えてくると重くなるので、その場合は他の言語やOSのコマンドでファイル一覧のテキストを読み込ませて処理させた方が効率的ですが、ちょっとした処理やディレクトリ毎の処理ならlist.files便利。 path <- 'C:/data/' # パスを指定してディレクトリ・ファイルパスを取得。 list.files(path) # カレントディレクトリを移動してディレクトリ・ファイルパスを取得。 setwd(path) list.files() # パターンを指定して取得(「txt」が含まれるものを取得)。 list.files(path, pattern="txt") # サブディレクトリを含めてファイルパスを取得。 list.files(path, recursive=T) # サブディレクトリを含めてファイルパスを

    R:list.filesによるファイルパス取得あれこれ。 - Qiita
    silovar
    silovar 2019/05/06