タグ

2015年9月16日のブックマーク (5件)

  • トレジャーデータで実践:Basket 分析(心の準備編) - トレジャーデータ(Treasure Data)ブログ

    Treasure Data - データ分析をクラウドで、シンプルに。 - Treasure Data はじめに 前回の「頭の体操編」では,数字やトランプの組み合わせの抽出をSQLで実践してみました。題に入る前に,今回はこの「組み合わせ」が引き起こすバスケット分析の質的な問題の1つ:「計算量の問題」について説明し,分析の際にはいつもこの問題を心にとめておいてもらえる事を目的としています。 SQLで頭の体操 〜組み合わせの計算〜(続) 前回に引き続いてもう2つだけ頭の体操をしましょう。下のトランプテーブルを使います。 課題9:53枚のトランプのペアの組み合わせを全て考える。 今回の課題はシンプルに,53種のカードのペアが取り得る組み合わせ(順序は別とします)を考えてみましょう。クエリは課題1と同じです。 さて,このクエリで全部で何種類のペアが生成されたのでしょうか? 答えは 2,809 通

    h1sao
    h1sao 2015/09/16
  • [R]SQLクエリでRのデータを加工・集計できるパッケージ「sqldf」 - データ分析がしたい

    私が分析を行う際、データ加工や集計作業は基的にSQLで行い、分析やモデル作成はRで行うことが多いです。 しかし、DBが使えないような場合やちょっとした集計などRでデータを加工・集計したい場合があります。 RでSQLで行うようなデータ加工・集計を行うには、基的にsubsetやorder、merge、aggregateといった関数を利用します。 (SQLとRの関係については、以下のページがわかりやすいです。 http://d.hatena.ne.jp/a_bicky/20110529/1306667230) ただ、こういった関数はよく使い方を忘れてしまい、Webなりヘルプなりを使うたびに調べるなんてことが起こります。 正直、かなり面倒なわけです。 そこでSQLクエリを使って直接Rのデータを加工できたら良いなーと思うわけですが、 「sqldf」パッケージを用いれば直接SQLを利用してデータを

    [R]SQLクエリでRのデータを加工・集計できるパッケージ「sqldf」 - データ分析がしたい
  • 【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita

    統計をこれから学ぼうという方にとって、非常に重要な概念ですが理解が難しいものに「標準偏差」があると思います。「平均」くらいまでは馴染みもあるし、「わかるわかるー」という感じと思いますが、突如現れる「標準偏差」 の壁。結構、この辺りで、「数学無理だー」って打ちのめされた方もいるのではないでしょうか。 先にグラフのイメージを掲載すると、下記の赤い線の長さが「標準偏差」です。なぜこの長さが標準偏差なのか、ということも解き明かしていきます。 (code is here) 記事では数学が得意でない方にもわかるように1から標準偏差とはなにか、を説明してみようという記事です。 数式はわかるけど、イマイチ「標準偏差」の意味わからんという方にも直感的な理解がしてもらえるような説明もしていきますので、ぜひご覧ください。 (※ この記事では標準偏差の分母に $n$を使用しています。$n-1$を使用するケースも

    【統計学】初めての「標準偏差」(統計学に挫折しないために) - Qiita
  • 社内政治に頼らず新規事業開発を成功させる9つのコツ | ハイクラス転職ならdoda X(デューダエックス)

    doda X(旧:iX転職)は、パーソルキャリアが運営するハイクラス転職サービス。今すぐ転職しない方にも登録いただいています。 今の自分の市場価値を確かめてみましょう。 新規事業の開拓、新しい分野への挑戦の必要は、昨今、大企業では当たり前のように語られています。と同時に、その当事者であるみなさんにとってはいつも頭の痛いテーマでもあるのではないでしょうか? 一方で、この変化の激しい時代にあって、大企業における「新規事業」への取り組み方、成功パターンといったものは、5年前、10年前とは異なる要素、異なるアプローチが求められている可能性もあります。 こうした背景から「いま個人として、新規事業に求められる力とは何か?」をテーマに、実際に新規事業に関わり、それを成功させてきた方々、およびこれから新規事業にチャレンジする方々、約50名で議論しました。記事では、その内容を集約してお届けします。 結論か

    社内政治に頼らず新規事業開発を成功させる9つのコツ | ハイクラス転職ならdoda X(デューダエックス)
  • リレーショナルデータベースの仕組み (1/3) | POSTD

    リレーショナルデータベースが話題に挙がるとき、私は何かが足りないと思わずにはいられません。データベースはあらゆるところで使われており、その種類も、小規模で便利なSQLiteからパワフルなTeradataまで様々です。しかし、それがどういう仕組みで機能しているかを説明したものとなると、その数はごくわずかではないでしょうか。例えば「リレーショナルデータベース 仕組み」などで検索してみてください。ヒット数の少なさを実感できると思います。さらにそれらの記事は短いものがほとんどです。逆に、近年流行している技術(ビッグデータ、NoSQLJavaScriptなど)を検索した場合、それらの機能を詳しく説明した記事はたくさん見つかると思います。 リレーショナルデータベースは、もはや大学の授業や研究論文、専門書などでしか扱われないような古くて退屈な技術なのでしょうか? 私は開発者として、理解していないものを

    リレーショナルデータベースの仕組み (1/3) | POSTD