タグ

統計に関するf-sugerのブックマーク (10)

  • 最近学んでいる事と知識のレイヤー構造|Go Ando / PREDUCTS / THE GUILD

    こんにちはTHE GUILDの@goandoです。 先人達から学びを得るために、UXを中心に日々色んな書籍を参考にしているのですが、最近はデータ分析の為の統計学を主に読んでいます。また以前からUXの為に行動経済学・認知心理学の書籍から気付きを得る為に参照しています。 これらの書籍が自分のスキルと活動の中でどういう補完関係になっているのかを一度整理したので、共有してみたいと思います。 自分のスキルセットについて自分のキャリアパスというのが以下の様な流れになっており、大手SIer → ベンチャー → 個人デベロッパー → 現在、と4フェーズ目になっています。 (※ポーズに特に意味はありません) SIer時代は1000万人が使う大規模システムを一から構築したり、米国企業との事業開発をしたり、ベンチャー時代はカーネギーメロン大の言語学者と共同開発を行い、iPhone黎明期には個人デベロッパーとして

    最近学んでいる事と知識のレイヤー構造|Go Ando / PREDUCTS / THE GUILD
  • A/Bテストに用いられる統計的検定手法(ロジック)のまとめ&比較 | RCO Ad-Tech Lab Blog

    リクルートデータ組織のブログをはじめました。※最新情報はRecruit Data Blogをご覧ください。 Recruit Data Blogはこちら 汎用人型雑用AIの stakaya です。 たまたま数年前に社内のBLOGに書いたABテストのロジックのまとめ&比較記事を発掘したので、 このまま眠らせているのはもったいないぞと、 圧倒的もったいない精神を発揮し、シェアさせていただきます。 あの頃は私も若かった。 社内では”堅物・真面目・一途”で有名なものでして、下記文章がお硬いのはご勘弁ください。 はじめに 記事は、施策の評価手法としてしばしば用いられるA/Bテスト(A/B testing)について、できる限り背後にある仮定を明記した上で、まとめたものである。 A/Bテストとは、主にインターネットマーケティングにおける施策の良否を判断するために、2つの施策(通常、A・Bと記載)を比較す

    A/Bテストに用いられる統計的検定手法(ロジック)のまとめ&比較 | RCO Ad-Tech Lab Blog
  • ソフトウェアのための統計学 – 前編 | POSTD

    ソフトウェア開発の原点は可能性の追求であり、不可能を可能にすることです。ひとたび ソフトウェア が開発されると、エンジニアは次に 程度 という課題に向き合うことになります。企業向けのソフトウェアであれば、「速度はどれくらいか」と頻繁に問われ、「信頼性はどの程度か」という点が重視されます。 ソフトウェアのパフォーマンスに関する質問に答え、さらには正しい内容を語る上で欠かせないのが統計学です。 とはいえ、統計学について多くを語れる開発者はそうはいません。まさに数学と同じで、一般的なプロジェクトで統計学が話題に上ることなどないのです。では、新規にコーディングをしたり、古いコードのメンテナンスをしたりする合間に、手が空くのは誰でしょうか? エンジニアの方は、ぜひ時間を作ってください。近頃は、15分でも貴重な時間と言えるでしょうから、 こちらの記事をブックマークに追加 しておいてもいいでしょう。とに

    ソフトウェアのための統計学 – 前編 | POSTD
  • 「闇雲にPDCAサイクルを高速に回す」と場合によっては過学習して逆に怖いかもというお話 - 渋谷駅前で働くデータサイエンティストのブログ

    3年前にこんな話を書いたわけですが、皆さんご記憶でしょうか。 この当時は「平均への回帰」という言葉にその不毛さを託したわけですが、前回の記事に着想を得てもう少し今時っぽく論じることが出来るんじゃないかと思ったので、ちょっと書いてみようかと思います。 なお、言うまでもありませんが以下に示す例は完全に単なるシミュレーションであり、特定の事例を意味するものではありません*1。過去にデータ分析業界の内部で見聞された数々の事例の最大公約数的な部分をベンチマークとしてまとめたものとご理解下されば幸いです。またシミュレーション自体も特に数理的な厳密さを期したものではありませんので、そこもご了承あれ*2。 ビジネスの現場でよくある光景 一般に「PDCAサイクルをとにかく速く回す」のがビジネスを成功させる近道だと言われるわけです。そこで、こんなケースを考えてみます。設定としては、何かしらのeCommerce

    「闇雲にPDCAサイクルを高速に回す」と場合によっては過学習して逆に怖いかもというお話 - 渋谷駅前で働くデータサイエンティストのブログ
    f-suger
    f-suger 2016/05/08
  • データドリブンで制作された大ヒットドラマ「House of Cards」、何がデータドリブンなのか調べてみた | Be Magnetic!

    Be Magnetic! サンフランシスコから気になるスタートアップのサービスやプロダクト、日々のよしなしごとを発信しています。 政治系サスペンスドラマ「House of Cards」にはまっています。陰謀と策略、駆け引き、愛憎劇とドロドロな感じがたまりません。日でもHulu(2週間無料)やAmazon(1話目無料)で見ることができるこのドラマ、Netflixという動画配信サービスのオリジナル制作ドラマです。 Netflixの今年の第2四半期決算の収益は$1.64 billion(約2,000億円)!この秋、日でもサービス開始予定ですが、最初はDVDレンタルの会社(TSUTAYA DISCASのようなネット宅配サービス)としてスタートし、そこからインターネットを経由した動画配信サービスをはじめ、今ではオリジナルドラマを制作して配信しています。 最初の作品である「House of Car

    データドリブンで制作された大ヒットドラマ「House of Cards」、何がデータドリブンなのか調べてみた | Be Magnetic!
  • 食べログの口コミに見る人間心理 ―麻薬と性とトラウマと― · Naoki Orii's blog

    フランスの希代の美家であるブリア・サヴァランは「ふだん何をべているのか言ってごらんなさい、そしてあなたがどんな人だか言ってみせましょう」といったそうだ。これは、「ドン・キホーテ」の有名な一文「君の友人を教えなさい、そうすれば君がどういう人間か言ってみせよう」をもじったものであるが、示唆に富んだ文である。その人が何をべるか(もっと正確に言えば、何をべないか)によって、その人の育ちや信仰、文化的・民族的背景など様々なことを知ることが出来る。 同様に、口コミもそれを書いた人について多くを物語る。ここで試しに、以下に挙げたべログの口コミを読んで頂きたい。 バラのクリームにたっぷりのフランボワーズをマカロンとともに。ルバーブのアクセント。コレめっちゃカワイイ(*^_^*) 一目ぼれです☆ バラにフランボワーズにマカロンにピンクときたら、女子にはたまらない~! ちょっと高めの価格設定やけど、

    食べログの口コミに見る人間心理 ―麻薬と性とトラウマと― · Naoki Orii's blog
  • 非エンジニアにもオススメ。数学が苦手な統計初心者がR言語を触ってみる。

    #################################### # CSVファイルの読み込み #################################### #Mac読み書きディレクトリを定義 basedata<-"/Users/saity/Dropbox/R/basedata/" output<-"/Users/saity/Dropbox/R/output/" #CSVファイルの読み込み crime<-read.csv(paste(basedata,"crime_prefecture.csv",sep=""), row.names=1) ソースコードを実行するには、カーソル行でcommand+enter(WinはCtrl+Enter)で実行ができます。 一度に複数行を実行する場合には、選択行で上記コマンドを叩きます。すると、メインコンソールに実行結果が表示されます。

    非エンジニアにもオススメ。数学が苦手な統計初心者がR言語を触ってみる。
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • Facebook、他人が写真アルバム全削除できるバグがあった

    Facebook、他人が写真アルバム全削除できるバグがあった2015.02.13 17:155,519 福田ミホ 良い人に見つけられてよかったです。 あるセキュリティ・リサーチャーが、Facebookでとんでもないバグを発見ました。たった4行のコードで、第三者からFacebook上の写真アルバムを削除できる状態だったんです。マーク・ザッカーバーグCEO結婚式写真も、赤の他人の高校の卒業アルバムも、公開されているアルバムならすべてです。でも幸い発見者はこれを悪用することなく、Facebookにすぐさま連絡してくれました。 Facebookのセキュリティチームだってユーザーデータの管理には万全を期していると思われますが、どんなに綿密にバグをチェックしたって漏れがないとは限りません。なのでFacebookには報奨システムがあって、重要なバグを見つけてFacebookに連絡した人には、その重要度

    Facebook、他人が写真アルバム全削除できるバグがあった
  • 1