タグ

統計に関するhush_inのブックマーク (20)

  • 総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス演習

    第1週:データ分析に基づく問題解決プロセスを紹介 ・データサイエンスの発展 ・社会で起きている変化~データサイエンスの必要性~ ・データサイエンスに求められるスキルや知識 ・データサイエンスの未来と発展 ・データサイエンスのサイクルと課題解決の進め方 ・分析の手法の選択 第2週:記述統計によるデータの把握と比較の方法を学ぶ ・Analysis(分析)とは ・1変数の状況の把握(1)(可視化の活用) ・1変数の状況の把握(2)(代表値の活用) ・比較して2変数の関係を見る ・ビジネスにおける比較(1)(概要) ・ビジネスにおける比較(2)(適切なA/Bテストの活用)

    総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス演習
  • 『データ分析のための統計学入門』無料PDF公開中 データサイエンティストら執筆 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

    『データ分析のための統計学入門』無料PDF公開中 データサイエンティストら執筆 | Ledge.ai
  • 総務省が無料データサイエンス講座を開講、松尾豊氏ら講師に | Ledge.ai

    画像は『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より 総務省は9月29日から、実践的なデータ分析の手法を学習できるとうたう、データサイエンス・オンライン講座「社会人のためのデータサイエンス演習(外部サイト)」を開講している。登録料および受講料は無料。閉講日時は12月7日の23時59分。 講座では、ビジネスや行政での活用を想定しており、社会人や大学生に向けて、ビジネスや業務上での分析事例を中心に実践的なデータ分析(統計分析)の手法をわかりやすく解説するという。前提条件は表計算ソフトMicrosoft Excelの基的な操作ができること。 『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より 講師は、総務省統計局の會田雅人氏、総務省統計局の阿向泰二郎氏、株式会社電通の佐伯諭氏、東京大学の松尾豊氏、株式会社ブレインパッドの奥園朋実氏、株式会社ブレインパッドの

    総務省が無料データサイエンス講座を開講、松尾豊氏ら講師に | Ledge.ai
  • 「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary

    データサイエンティストを生業にする手段と実態について述べる。 途中、具体例・境界値の例として私個人の話もするが、なるべく一般性のある話をする。 この記事で言いたいことは具体的には4つだ。 プログラミングスクールをディスるなら代わりの入門方法を提供しようよ。 もう「未経験文系から3ヶ月でデータサイエンティストで一発逆転物語」を止めろ。*1 おじさんは人生逆転したいなら真面目にやれ。 若者はワンチャンじゃなくて、ちゃんと化け物になれよ。 この記事についてはパブリック・ドメインとして転載・改変・リンク記載を自由にしてよいです。 (続き書いた) a. 入門は辛いが… b. 思考停止でプログラミングスクールに通うな。 なろう系・始めてみよう系資料一覧 (最速・最短ルート用) まずは動かしてみよう。強くてニューゲームが体験出来るぞ! 入門以前の 一般向け業界 (AI業界と展望がわかる) 技術者入

    「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary
  • えるエル on Twitter: "東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販の本を買うよりは,この3… https://t.co/w2cSVIxmUI"

    東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販のを買うよりは,この3… https://t.co/w2cSVIxmUI

    えるエル on Twitter: "東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販の本を買うよりは,この3… https://t.co/w2cSVIxmUI"
  • 食べログ3.8問題に終止符を打つ

    import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import json import glob import math from pathlib import Path from collections import Counter from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix from sklearn.metrics import roc_auc_score from sklearn.model_selection imp

  • 縦軸に目盛のないグラフ(インターネットもデータ分析も好きなぼくが、入社一年未満でWeb解析コンサルタントを辞めた理由) - 廿TT

    主張 縦軸に目盛のない棒グラフや折れ線グラフを描くのはやめよう。 棒グラフ 以前の職場でよく見かけた棒グラフがこのようなものでした。 これは万能棒グラフです。 2007-10-22 - 定義すれば存在する 目盛のベースラインが 0 スタートでなくてもいい 目盛線は省略していい という風に棒グラフを書いてしまうとどんなデータにもあてはまる、万能棒グラフができあがります。 どんなデータにもあてはまるとは、つまりデータの特徴をなにも表せていない統計グラフということです。 統計グラフとしての機能をはたしません。 折れ線グラフ また、このような折れ線グラフもよく見かけました。 ここで、折れ線グラフは縦軸の幅を広くとれば大きな差を小さくみせ、狭くとれば小さな差を大きく見せることができることに注意してください。 縦軸に目盛がないと、この目盛操作に気づくのは困難です。 退職の理由 わたしは新卒で Web

    縦軸に目盛のないグラフ(インターネットもデータ分析も好きなぼくが、入社一年未満でWeb解析コンサルタントを辞めた理由) - 廿TT
  • Optimizelyを使ってクビになりかけたワケ ~統計学が苦手なマーケターへの薦め~ | POSTD

    (訳者注: 検定手法について、この記事には一部内容が古い部分があります。Optimizelyは現在、両側検定を採用し、独自開発したより精度の高い統計手法(Stats Engine)でテスト結果を表示しています。Stats Engineに関する記事: 日語 ・ 英語 ) 私たちがSumAllでA/Bテストを一斉にスタートさせて6ヶ月が経ち、あまりよくない結末を迎えました。それは勝算があるとした結果のほとんどが新規ユーザーの獲得改善にはつながらなかったことです。それどころか、私たちは失敗したのです。そして私の一番の責任はユーザー獲得の増加であるということを考えると、当に最悪の状況でした。私にとっても、私のキャリアにとっても、そしてSumAllにとっても。 過去に A/BテストとWebサイト・パーソナライゼーションの会社 に勤めていた経験から(はっきり言うとMonetateはOptimize

    Optimizelyを使ってクビになりかけたワケ ~統計学が苦手なマーケターへの薦め~ | POSTD
  • 実証分析入門|日本評論社

    第1章  実証分析における心構え: これからの「実証」の話をしよう 第2章  実証分析の落とし穴: こんなの絶対おかしいよ 第3章  確率統計の基礎: 高校時代に逢った、ような…… 第4章  OLS: わたしの、最高の友達 第5章  重回帰分析: 魔女の作り方 第6章  決定係数R2: ☆もりはつ☆の59%は勢いで出来ています 第7章  仮説検定(1): お前はもう死んでいる 第8章  仮説検定(2): 私が死んでも代わりはいるもの 第9章  さまざまなモデル: ダミーも、交差も、あるんだよ 第10章  バイアス: いや、そのりくつはおかしい 第11章  不均一分散への対処: こんなこともあろうかと 第12章  目的変数が質的変数の場合の分析手法: 飛ばねぇ豚はただの豚だ 第13章  最尤法(MLE): OLSとは違うのだよ、OLSとは! 第14章  目的変数が三択以上の場合の場合の分析手

    実証分析入門|日本評論社
  • エンジニアのためのデータ可視化実践入門という本を書いた - あんちべ!

    2014/10/14 追記 書87ページに「母数」という単語が複数回出てきますが、 これは全て「分母」とすべきでした。*1 通常、統計学の文脈では、母数は各確率分布を特徴付ける変数を指す単語であり、 例えば正規分布は平均と分散という二つの母数によって形状が決定されます。 決して母数と分母(あるいは全数)と誤解してはなりません。 しかし母数と分母を混同することは当によくあることで、 書はこのような頻出する誤解を訂正し、 皆様が統計を用いる際の失敗を一つでも減らす という目的で執筆に至ったにも拘らず、 まさか書でこのような重大な失敗をしてしまったことに対し 心からお詫び申し上げ訂正させて頂きます。 なお、問題個所の記述は共著者の森藤氏ではなく 私が記述したものであり、全責任は私にあります。 を書くに当たり、誤字脱字や言い回しの不備は出来る限り無くすべきですが、 人間であるためミスをす

    エンジニアのためのデータ可視化実践入門という本を書いた - あんちべ!
  • クリスマス暇過ぎて腐女子人気作品の探索的データ解析を行うしかなかった - あんちべ!

    はじめに クリスマスはいつものように全く予定無かったあんちべです、こんばんは! 皆様はクリスマスをお楽しみになられましたでしょうか? 「今yesと答えた奴ら全員地獄に堕ちろ」ってサンタさんにお願いしておいたからな。 さて、世間のリア充様がクリスマスで浮かれまくりやがっていらっしゃる中、 やること無さ過ぎていつものようにpixiv腐女子向け作品を眺めていたところ、 ありがたいことに寂しさを感じる暇もない勢いでどんどん作品が投稿されていました。 ハッピーですね! …………? クリスマスの真っ只中に腐女子絵を投稿している…だと!? クリスマスと言えば皆さんお楽しみのはずでは? いや、クリスマスの夜にむしろ投稿数が増加しているような気が…? という疑惑を抱いたので、実際データを色々眺めてみましょう。 データの説明 データはpixivから下記タイトルで検索した結果を12/26の午前中時点で 各々1

    クリスマス暇過ぎて腐女子人気作品の探索的データ解析を行うしかなかった - あんちべ!
  • 進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!

    はじめに 最近超人気の漫画として私のTwitter TLを賑わす作品、その名も「進撃の巨人」。 これだけ人気なんだからきっと面白いに違いないのですが、 なんか絵が怖そうだし、人がバンバン死んでてグロいっぽいという噂を聞くので、 なんとか漫画を読まずに、それでいて進撃の巨人のキャラについては知りたい、 そう願う潜在的進撃の巨人ファンも全国に70万人くらいいらっしゃると思います。 そこで、データから進撃の巨人にどんなキャラが登場するか推測してみましょう。 扱うデータとして、pixivのタグ情報を利用します。 商品レビューコメントなどとは違い、ファンの創作活動がダイレクトに反映されるサービスなので、 そこに付与されるタグ情報は、ファンの熱(過ぎる)いメッセージが込められているに違いありません。 今回、以下のような縛りを入れています。 1.勿論原作は見ない 2.pixivのタグ情報は参照するけど、

    進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!
    hush_in
    hush_in 2013/08/05
    すげー。自分でもやってみたい。
  • 機械学習の理論と実践

    SACSIS2013でのチュートリアル講演資料です。機械学習の導入:背景、手法、理論、応用)、実践:オンライン学習+線形分類で実際作ってみる、使う際の課題、発展:分散+リアルタイムでの機械学習(Jubatus)、深層学習(Deep Neural Net)についてまとめましたRead less

    機械学習の理論と実践
  • 統計の教科書を公開 - 【小波の京女日記】(2013-03-12)

    _ 統計の教科書を公開 2013年度の学部の講義「統計学」で使用するための教科書を公開します. http://ruby.kyoto-wu.ac.jp/~konami/Text/ このテキストは,今年度まである出版社から出してもらっていたのですが,かなりの訂正と加筆を行い,元のからはかなり内容が離れてきてしまいました.また出版社も,売れ行きがぜんぜん悪いし,カリキュラムが変わって100人以上いた受講者が30人程度に激減して儲けのタネにならなくなり,書店から引き上げてしまったようです. そこで,思い切って改訂版はネットに公開して一般の人に自由に使ってもらい,学生が授業で使う分については,小部数印刷の業者に必要なぶんだけ印刷製してもらうことにしました.なんと2日で製までやってくれるということで,初回の授業で注文をとってから印刷すれば,次の講義では使えるわけです.便利な世の中です. どんな教

  • Web系女子がLispと出会って統計学に目覚めるまでのお話 - あんちべ!

    こんにちは!今年の春からWeb系企業でHTML/CSSデザイナーとして働きだしたキラキラ女子(を目指してる)のあんちべ(23)です!よろしくお願いします!私は普段自社のWebサービスCSSなどを書いている*1のですが、最近データマイニングに興味を持ち始め、データを分析して、自社サービスの売り上げ改善に貢献したいなーと思うようになりました!でも。。。私は文系出身で統計学とか全然わからない*2し、プログラミングも得意じゃない*3し、高価な統計解析ソフトを買うのも辛いです。。。無い無い尽くしですね><;!そんな私に救いの手が!インストール作業不要で、便利な統計処理機能が色々あって、しかも無料という素晴らしいソフト*4を発見しました!その名も"Incanter"です!なんでも、 Lispっていう古くから使われてきた実績のあるプログラミング言語で動いてて、Lispの文法でどんな処理をすればよいかを

    Web系女子がLispと出会って統計学に目覚めるまでのお話 - あんちべ!
  • データ分析の重要性を理解するための入門書5冊 - UNIX的なアレ

    はじめに 今回紹介するは玄人向けではなく「データ分析が重要そうだけど、なんだかよくわかんないと思っている人」向けです。 昨今ではデータマイニングという単語がエンジニアやマーケティング担当者のものだけでなく、経営レイヤーでも重要視されてきています。 ビッグデータというバズワード的なものも頻繁に言われ始めて、めんどくさい上司とかはとにかく口にし出すような状況ではないでしょうか?(想像です) 勉強しないと!と思いはするものの、統計やらHadoopやらRやら、それにまつわるものが多すぎて何から手をつけていいのかわからないもの。 というわけで、私が最近読んだ中でも「何ができるものなのか」という浅く広いテーマについて触れているをいくつか紹介します。 統計学 統計学が最強の学問である 作者:西内 啓ダイヤモンド社Amazon cakesの連載をまとめたですが、統計学がどういった分野に使われているの

    データ分析の重要性を理解するための入門書5冊 - UNIX的なアレ
  • Seminar 130107 ver2_public_embed

    1. This document provides a summary of Tanaka Fuyuhiko's research interests and activities. It discusses his work on Q-stats, a website for disseminating statistical computing techniques, and potential areas for collaboration. 2. The document also outlines Tanaka's past work applying mathematical models to real-world problems and contributing to theoretical foundations. It encourages both direct a

    Seminar 130107 ver2_public_embed
  • 平均バストサイズ日本地図 - LC(エルシーラブコスメティック)の通販[LC公式]

    バストサイズの平均はどのくらいで、自分は平均に比べて大きいのか、それとも小さいのかは気になりませんか? 最近では、バストケアの習慣が幅広く浸透してきて、毎日のケアでサイズアップしたという方も増えていますが、それでも平均サイズがどのくらいなのかは気になりますよね。 そこで、2012年、2018年に引き続き、47都道府県の女性にバストについてのアンケートを実施し、都道府県別の平均バストサイズを調査しました。 ここ数年で女性のバストサイズは変わったのか?題して『平均バストサイズ日地図2023』発表です! ※ラブコスメのお客様アンケートにて【ご回答いただいた方のみの結果】となりますため、該当する県すべての方にお伺いした結果ではございません。あらかじめご了承くださいませ。

    平均バストサイズ日本地図 - LC(エルシーラブコスメティック)の通販[LC公式]
    hush_in
    hush_in 2012/04/10
    確かにそう言われると京都は大きいような気がする
  • 問:史上最も有名で、最も戦闘的だった統計学者は誰か? 答え:ナイチンゲール

    意志決定する人たちが数字に弱い。 基的に、四則計算しか/もできない。 かけ算割り算(それと按分ってやつ)に大小比較が、今でも最高の意志決定手段だったりする。 どれだけたくさんデータを集めても、平均値しか求めない(し知らない)。 かつて広大な領土を持つロシアでは、統計は非常に重要視された。 ほとんどのケースで「この目で見る」ことがかなわぬ状況で、統計の活用は(マイクロソフトのビル・ゲイツがそうだったように/例えば電気料金の詳細データから、照明がついている=それぞれの事務室が使用されているのべ時間を割り出し、各セクションの仕事の進捗具合や、人材の過不足を知った)、しゃぶりつくすまで徹底的に活用された。 でなければ、統治は不可能だった。 そのロシアとサルデーニャが組み、フランス、オスマン帝国およびイギリスを中心とした同盟軍と戦った。 戦闘地域はドナウ川周辺、クリミア半島、さらにはカムチャツカ半

    問:史上最も有名で、最も戦闘的だった統計学者は誰か? 答え:ナイチンゲール
    hush_in
    hush_in 2012/02/04
     かつて広大な領土を持つロシアでは、統計は非常に重要視された。  ほとんどのケースで「この目で見る」ことがかなわぬ状況で、統計の活用は(マイクロソフトのビル・ゲイツがそうだったように/例えば電気料金の
  • はてなブログ | 無料ブログを作成しよう

    盛岡旅行記 なぜ盛岡か。 白龍 店のじゃじゃ麺 岩手銀行赤レンガ館 白沢せんべい店の南部せんべい 盛岡天満宮と盛岡八幡宮 チーズケーキのチロル 大通店のクリームチーズケーキ フェザン/イオンタウン 盛岡駅前 盛楼閣の盛岡冷麺 福田パン 長田町店のパン マルイチ 材木町店 …

    はてなブログ | 無料ブログを作成しよう
    hush_in
    hush_in 2012/01/29
    もうちょっと英語勉強したら見る
  • 1