並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 283件

新着順 人気順

統計学の検索結果1 - 40 件 / 283件

統計学に関するエントリは283件あります。 統計データ学習 などが関連タグです。 人気エントリには 『食べログ3.8問題を検証 - クイックノート』などがあります。
  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上で食べログの星の数について、 ある問題が話題になりました。 食べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 食べログは飲食店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲食店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「食べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 食べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、食

      食べログ3.8問題を検証 - クイックノート
    • 高等学校情報科「情報Ⅱ」教員研修用教材(本編):文部科学省

      PDF形式のファイルを御覧いただく場合には、Adobe Acrobat Readerが必要な場合があります。 Adobe Acrobat Readerは開発元のWebページにて、無償でダウンロード可能です。

        高等学校情報科「情報Ⅱ」教員研修用教材(本編):文部科学省
      • えるエル on Twitter: "東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販の本を買うよりは,この3… https://t.co/w2cSVIxmUI"

        東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販の本を買うよりは,この3… https://t.co/w2cSVIxmUI

          えるエル on Twitter: "東大が無償でPDF公開している,統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて,各事例への統計学の応用手法,3は機械学習の人なら馴染み深い統計計算を解説 下手な市販の本を買うよりは,この3… https://t.co/w2cSVIxmUI"
        • 孫さんがPCR検査を大々的にやるとツイートしたら、多くの方から医療崩壊が起こるというメッセージが来ているようですが、なぜ医療崩壊が起こるんでしょうか?に対するKenn Ejimaさんの回答 - Quora

          • 総務省、きょうから「社会人のためのデータサイエンス入門」を無料開講 | Ledge.ai

            サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

              総務省、きょうから「社会人のためのデータサイエンス入門」を無料開講 | Ledge.ai
            • ガラケーしか使えないデジタル音痴だった私が「GISでデータ分析」できるようになるまでの話|NHK取材ノート

              東京の多摩川沿いの浸水リスクがある地域で、「なぜか人口が増えている」ことをデータ分析ソフトを使って明らかにして、その背景を探りました。 次にこんな記事も書きました。 南海トラフ巨大地震によって津波の浸水が想定されている区域で、高齢者の施設がすごく増えていることを示した記事です。 どちらの記事も、誰もが入手できる「オープンデータ」と、後述する「GIS」という分析システムを使って隠れた事実を浮き彫りにした、データジャーナリズムのお手本などと紹介されたこともあります。 そしてつい最近手がけたのがNHKスペシャル「〝津波浸水域〟の高齢者施設」。蓄積してきた分析のノウハウを注ぎ込んだ番組です。 「データ分析」というと専門的で、すごく難しく思う方もいるかもしれません。しかし最初に述べたように私は数年前までは、パソコンを満足に使えない、データ分析とは無縁の「ガラケー記者」だったのです。本当に。 そんな私

                ガラケーしか使えないデジタル音痴だった私が「GISでデータ分析」できるようになるまでの話|NHK取材ノート
              • 【新卒研修資料】基礎統計学 / Basic of statistics

                株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。

                  【新卒研修資料】基礎統計学 / Basic of statistics
                • バニラのアイスを買ったときだけ車のエンジンがかからなくなる不思議な現象、その原因は?

                  「目に見えて明らかなことが常に解決策であるとは限らず、どれだけ不思議に見えても事実は事実に過ぎない」ということに気づかされたとして、ウォータールー大学でコンピューターサイエンスを研究するスティーブン・マン教授が不思議なエピソードを紹介しています。 Car allergic to vanilla ice cream http://www.cgl.uwaterloo.ca/smann/IceCream/humor.html ある日、自動車メーカー・ゼネラルモーターズ(GM)のポンティアック開発部に以下のような内容の苦情が寄せられました。 「私がGMに苦情を書いたのはこれで2回目です。私にもおかしな話に思えるので、返事がなくても責めるつもりはありません。私たちの家族はいつも夕食後のデザートにアイスクリームを食べています。毎晩、食事後に家族全員がどの種類のアイスクリームを食べるべきかを投票し、私が

                    バニラのアイスを買ったときだけ車のエンジンがかからなくなる不思議な現象、その原因は?
                  • 9割の人が知らない再現性の危機 - 本しゃぶり

                    本で読んだ知識をドヤ顔で紹介したら、その実験には再現性がありませんでした。 そんな恥ずかしい記事を書いたブロガーは誰でしょう? そう、私です。 ステレオタイプ脅威はありますん ちょっと前に「ステレオタイプ脅威」の記事が話題になっていた*1。 世の中には「女性は数学に弱い」というような負のステレオタイプがある。自分のアイデンティティがそれに該当していると意識してしまうと、実際にパフォーマンスが落ちるというものだ。これは様々な実験の結果によって示されている。というのが記事で紹介されていた話だった。 ところが現在、その「実験結果」は再現性が無いと言われている。ステレオタイプ脅威の根拠は実験結果にあるというのに、その土台は不確かなものであるのだ。 とくに、最近の研究ではほとんど再現性がないとされている「ステレオタイプ脅威」について、リベラルバイアスにも言及しながら議論しているのが印象的。 日本では

                      9割の人が知らない再現性の危機 - 本しゃぶり
                    • 統計学の講義資料(2022年度) | Logics of Blue

                      帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 目次 本資料について 統計学の講義資料 1.本資料について 帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。 もとの講義資料とは異なる点もあるのでご注意ください。 万が一何か問題があれば、当ブログにコメントをいただけますと幸いです。 スライドにも記載の通り、以下の利用を想定しています。 想定①:講義の受講者が復習に利用する 想定②:未受講者が統計学入門資料として利用する 基本的には想定①ですが、文系の学生をメインターゲットとした統計学の本格的入門資料は少ない印象です。 未受講者の方にも役に立つかもしれないと思いWeb上で公開することにしました。 本資料は1年間にわたる講義資料となっています。数回

                      • 統計の入門講座が無料に、京大メソッドでデータサイエンス関連教員が担当 | Ledge.ai

                        サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                          統計の入門講座が無料に、京大メソッドでデータサイエンス関連教員が担当 | Ledge.ai
                        • まあ、なんちゅうか、トラバも盛大に伸びているので、私の書くここまで、..

                          まあ、なんちゅうか、トラバも盛大に伸びているので、私の書くここまで、元増田は辿り着かないかもしれませんが・・・ 私はゲノム科学者ですが、元増田の持つ疑問は、別に自然なものだと思うんですよね。というより、ゲノム配列決定が非常に身近になっている昨今、ちゃんと向き合っていかなければならない疑問だと思っています。私は私の持つ知識の範囲で、疑問にお答えしたいと思います。倫理は専門外なので扱いません。タブーとか扱いません。裏の意図を読もうとしているブコメが多数ありましたが、理系なのでよくわかりません。 まず、元増田の挙げているような、運動能力、将棋の能力、見た目の美醜とか、学歴、といったヒト個人ごとに異なる特徴を「形質」と言います。形質を遺伝学の観点から見ると大きく分けて二つあり、単一遺伝子型(メンデル型)と多遺伝子型(多因子型)です。 おそらく優生学にせよ遺伝にせよ、専門外の人が通常頭に思い浮かべる

                            まあ、なんちゅうか、トラバも盛大に伸びているので、私の書くここまで、..
                          • 『データ分析のための統計学入門』PDFが無料公開 データサイエンティストたちが執筆 | Ledge.ai

                            サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                              『データ分析のための統計学入門』PDFが無料公開 データサイエンティストたちが執筆 | Ledge.ai
                            • 食べログ3.8問題に終止符を打つ

                              import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import json import glob import math from pathlib import Path from collections import Counter from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix from sklearn.metrics import roc_auc_score from sklearn.model_selection imp

                              • Google が公開している、より良いデータ分析のためのガイドブック「Good Data Analysis」で、データ分析の要所が簡潔にまとめられていて感動した

                                Google が公開している、より良いデータ分析のためのガイドブック「Good Data Analysis」で、データ分析の要所が簡潔にまとめられていて感動した 2022-03-08 Google の非公式ブログで、The Unofficial Google Data Science Blog というデータサイエンスをテーマにしたブログがある。 その中で、 Practical advice for analysis of large, complex data sets の記事を元にして作られた Google Developers Guides: Machine Learning Guides > Good Data Analysis を昨日見かけて読んでいたら素晴らしいドキュメントだったので、ここでその感動を共有したかったので筆をとったしだい。 Good Data Analysis の概

                                  Google が公開している、より良いデータ分析のためのガイドブック「Good Data Analysis」で、データ分析の要所が簡潔にまとめられていて感動した
                                • 数学とプログラミングの勉強を開始して、何度も挫折して今に至る軌跡を晒す

                                  2013年の秋、その時の自分は30代前半だった。 衝動的に数学を学び直すことにした。 若くないし、数学を学びなおすには遅すぎると思って尻ごみしていたが、そこを一念発起。 というか軽い気持ちで。ぶっちゃけると分散分析とやらに興味を持ったから。 数学というか統計かな。 統計的に有意差があったといわれてもその意味がさっぱりだった。 一応、理系の大学を出てるので、有意差という単語をちょいちょい耳にはしていたが、 「よくわかんないけどt検定とかいうやつやっとけばいいんでしょ?」 くらいの理解だった。 で、ありがちな多重比較の例で、3群以上の比較にt検定は使っちゃダメだよっていう話を聞いて、なんか自分だけ置いてけぼりが悔しくなって、Amazonをポチッとしたのが全ての始まり。 あと、あの頃はライン作業の工員だったから、脳が疲れてなかったし。 そんなわけで、自分の軌跡を晒してみる。 みんな数学とかプログ

                                    数学とプログラミングの勉強を開始して、何度も挫折して今に至る軌跡を晒す
                                  • 【Python】専門書や論文を読みたいけど数学が苦手・わからない人向けのコードを読んで学ぶ数学教本 - Qiita

                                    はじめに プログラミング自体は文系、理系、年齢関わらず勉強すればある程度ものになります。プログラミングがある程度できるようになるとTensorflow,PyTorchやscikit-learn等のライブラリで簡単にできる機械学習やデータサイエンスに興味を持つの必然! これからさらになぜ上手くいくのか・いかないのかの議論をしたい、社内・外に発表したい、理論的な所を理解したい、先端研究を取り入れたい、応用したい等々と次々に実現したい事が増えるのもまた必然でしょう。このときに初めて数学的なバックグラウンドの有無という大きな壁が立ちはだかります。しかし、数学は手段であって目的ではないので自習に使える時間をあまり割きたくないですよね。また、そもそも何から手を付けたら良いかわからないって人もいるかと思います。そんな人に向けた記事です。本記事の目標は式の意図する事はわからんが、仕組みはわかるという状態に

                                      【Python】専門書や論文を読みたいけど数学が苦手・わからない人向けのコードを読んで学ぶ数学教本 - Qiita
                                    • 「月曜日のたわわ」を人々はどう見るか/田中辰雄 - SYNODOS

                                      1.はじめに 日経新聞に載った「月曜日のたわわ」の広告は波紋を呼んだ。「月曜日のたわわ」は青年漫画誌の連載漫画であり、その漫画のキャラを使った広告が不適切であるとして批判されたのである。批判の趣旨は、広告で描かれた絵は女子高生を性的に扱っており、新聞の広告として不適切という点にある。これに対し、表現の自由で許される範囲であるという反論がなされ、活発な論争が起きている。 これに類似の論争はこれまでに何度も繰り返されてきた。古くは、人工知能学会表紙事件(2014年)、新しくは宇崎ちゃん献血ポスター事件(2019年)、そして直近では温泉むすめの事件(2020年)が記憶に新しい。 これらの論争では、人々がその表現をどう受け取るかが争点の一つである。しかし、騒動の渦中に人々がその表現をどう受け取っているかが調べられた例は多くはない。本稿ではこれを試みる。この広告に対して批判する意見、容認する意見はど

                                        「月曜日のたわわ」を人々はどう見るか/田中辰雄 - SYNODOS
                                      • 統計の入門

                                        この講座は『受講登録する(無料)』ボタンを押すと受講開始となる『開始日可変型講座』です。 『開始日可変型講座』とは、受講者個々の受講開始日に応じて進行する講座です。 ご自身のスケジュールは、以下の講座スケジュール(PDF)を参考にご確認ください。 講座内容 統計に関する知識は、実験、試験、調査などの結果を用いた実証研究を行う上でなくてはならないものである。生活に関わるさまざまな効果やリスクがデータとともに語られ、生活者としても統計に対するリテラシーが求められるようになった。企業活動では、情報技術の発展によって、日々膨大なデータが生成されており、その活用が求められるようになった。本講座は、研究や、生活、社会・経済活動に不可欠な統計を、集計・分析し、理解する力を養うことを目的とした「統計入門」「続統計入門」を圧縮した内容になっている。これから統計を学ぼうとする初学者や、学び直しを目指す学生を主

                                          統計の入門
                                        • 線形代数を学ぶ理由 - Qiita

                                          はじめに 少し前(2019年4月頃)に、「AI人材」という言葉がニュースを賑わせていました。「現在流行っているディープラーニングその他を使いこなせる人材」くらいの意味だと思いますが、こういうバズワードの例の漏れず、人によって意味が異なるようです。併せて「AI人材のために線形代数の教育をどうするか」ということも話題になっています。 線形代数という学問は、本来は極めて広く、かつ強力な分野ですが、とりあえずは「行列とベクトルの性質を調べる学問」と思っておけば良いです。理工系の大学生は、まず基礎解析とともに線形代数を学ぶと思います。そして、何に使うのかわからないまま「固有値」や「行列式」などの概念が出てきて、例えば試験で3行3列の行列の固有値、固有ベクトルを求め、4行4列の行列の行列式を求めたりしてイヤになって、そのまま身につかずに卒業してしまい、後で必要になって後悔する人が出てきたりします(例え

                                            線形代数を学ぶ理由 - Qiita
                                          • もうなんか間違ったことしか書いてなくて増田が何でこんなもの書こうと思..

                                            もうなんか間違ったことしか書いてなくて増田が何でこんなもの書こうと思ったのかちょっと意味が分からないんだけど 一応気になったところだけ訂正・説明を入れておく。(ほぼ全文にわたっているが…) 途中で「なんでこんな中間テストの採点みたいなことやってんの…」みたいな気分になったけど 万が一これを読んで本気にしている人がいるといけないので義務感で最後まで書きました。 あまりの衝撃に最初からテンション高いですけどね。もう疲れたからこのまま上げます。 なんなんやいったい... 遺伝病の断種は、遺伝病の根絶について特に有効ではないと考えられています。まず、潜性遺伝病の場合はどうでしょうか。これは、両方の染色体に、多くは遺伝子機能欠失型の遺伝子変異があると起こります。親は、片方しか持っていなければ健康なのですね。すると、両方の遺伝子変異を持つ遺伝病患者を断種させたところで、片方だけを持つ親が世の中にたくさ

                                              もうなんか間違ったことしか書いてなくて増田が何でこんなもの書こうと思..
                                            • コロナウイルスなどのアウトブレイクは、なぜ急速に拡大し、どのように「曲線を平らにする」ことができるのか

                                              ワシントン・ポストでは、全ての読者がコロナウイルスに関する重要な情報へアクセスすることができるよう、この情報を無料で提供しています。無料講読を希望される方は、当社のデイリーコロナウイルスアップデートニュースレターへご登録ください。 COVID-19による感染が初めて確認され、この新型コロナウイルスによる感染症についてアメリカ国内でも公表されたが、さらなる感染については、ぽたぽたと滴り落ちるように、なかなか報告されていなかった。それから2ヶ月が経ち、その滴りはゆるぎない潮となって押し寄せてきたのである。 [Read this story in English] このいわゆる指数曲線は、専門家の間で懸念の原因となっている。もし感染者が3日ごとに2倍に増加するとなると、5月にはアメリカ国内での感染者が1億人ほどにまでのぼるであろう。 これは計算から導き出した数字であって、予言ではない。公衆衛生の

                                              • 東京の感染者数を5週間ぶん予測した (7月5日版)

                                                (※ 新しい予測を公開しました→ 東京の感染者数を5週間ぶん予測した (7月12日版)) 東京の感染者数を5週間ぶん予測した (6月21日版)、(6月28日版) の続き。まえがきは初回(6月21日版)の記事でご覧ください。 先週の予測は、日曜までの週単位で 4679人(6月21日版)、4502人(6月28日版) でしたが、現実は 4074人 となりました。少し下振れしたのでそれに合わせて今後の予想も下振れしますが、必ずしもこれから毎週累積で下振れしていくというわけではなく、週単位ではあくまで上下ともにブレる可能性が半々になるように予測しています。また、前回の記事で書いた上振れの時と逆ですが、下振れした週の感染者数は都民をそれほど緊張させず、3週後のブレーキが弱くなるため、やはり全体としての影響は限定的になります。 下振れのいちばん大きな要因は、人流データによるものでした。というのも、予測に

                                                  東京の感染者数を5週間ぶん予測した (7月5日版)
                                                • 新卒向け「統計学の基礎」100ページ超 SaaS企業が無料で資料公開

                                                  資料では、統計学がどんな学問なのか、統計学を学ぶことにどんな意義があるのかという初歩から解説。その上で統計学を「記述統計学」と「推計統計学」に大別し、それぞれの特徴や手法、注意点を説明している。 今回の無料公開は、ブレインパッドで働く有志のデータサイエンティストが技術資料などを外部に発信するプロジェクト「OpenBrainPad」の一環。「統計学をこれから学ぶ人も復習する人もぜひ利用してほしい」(ブレインパッド)という。同プロジェクトでは、過去にはプログラムのバージョンを管理するシステム「Git」のハンズオン(実際に手を動かして学ぶ)資料なども公開している。 関連記事 総務省「誰でも使える統計オープンデータ」無料オンライン講座スタート 総務省が「誰でも使える統計オープンデータ」を開講。統計オープンデータを活用したデータ分析の手法を解説する無料講座だ。 AIの基礎をZoomで講義 新人研修用

                                                    新卒向け「統計学の基礎」100ページ超 SaaS企業が無料で資料公開
                                                  • 『鬼滅の刃』大ヒットの理由が見つかることは無い - 本しゃぶり

                                                    誰もが知りたい『鬼滅の刃』大ヒットの理由。 これはどれほど丹念に作品と向き合っても答えは得られない。 なぜなら人の繋がりから生じる偶然の結果だからだ。 なぜ大ヒットしたのかという疑問 この『鬼滅の刃』解説記事に対する反応が興味深い。 このnoteは『鬼滅の刃』の導入を解説したものだ。どうやって読者を1ページ目から引き込むか、その「技術」と「困難」について書かれている。これに対し、ブコメはほぼ批判一色となった。 書いてある内容は決して間違っていないし、かなり細かく説明されている。なのになぜ批判が多いのか。コメントの内容は主に以下の2点となる。 『鬼滅の刃』に限った話ではない 長い 先に後者についてだが、「長い」ということは必ずしも悪ではない。スクロールバーが点になるような記事でも、好意的なコメントが多いこともある。結局のところ「長い」という批判が意味することは、自分の知りたいことが書かれてい

                                                      『鬼滅の刃』大ヒットの理由が見つかることは無い - 本しゃぶり
                                                    • WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times

                                                      主な確率分布の関連図 こんにちは、吉岡(@yoshiokatsuneo)です。 Webサービスを運営していると、利用状況を分析・予測したり、A/Bテストなどで検証したりすることがよくあります。 データを一個一個見ていてもよくわからないので、データ全体や、その背景の傾向などがまとめて見られると便利ですよね。そんなとき、データの様子を表現するためによく使われているのが「確率分布」です。 学校の試験などで使われる偏差値も、得点を正規分布でモデル化して、点数を変換したものです。 今回は、Webサービスなどでよく使われる確率分布18種類を紹介します。 それぞれ、Webサービスでの利用例やPythonでグラフを書く方法も含めて説明していきます。コードは実際にオンライン実行環境paiza.IOで実行してみることができますので、ぜひ試してみてください。 【目次】 正規分布 対数正規分布 離散一様分布 連続

                                                        WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times
                                                      • 実践データサイエンス─サンプルコードと図表で学ぶ、前処理・モデル評価・パラメータチューニング - エンジニアHub|Webエンジニアのキャリアを考える!

                                                        実践データサイエンス─サンプルコードと図表で学ぶ、前処理・モデル評価・パラメータチューニング 実践とともに、データサイエンスに入門しよう!敷居が高いと思われがちなデータサイエンスですが、データの前処理からの手順は意外とシンプルです。本記事では、データの前処理や特徴量の作成、モデルの評価・訓練、ハイパーパラメータの調整など、基本的な知識をサンプルコードと図表を見ながら学びます。 データサイエンティストとしてのスキルを向上させるには、データの前処理や特徴量の作成、モデルの評価・訓練、ハイパーパラメータの調整など、広域にわたる知識を身に付ける必要があります。 この記事は、そうした知識を「サンプルコードと図表を見ながら、分かりやすく学習できること」を目指して作成されました。記事内では、新米データサイエンティストのOさんが登場して、ある案件のデータ分析を担当します。読者のみなさんも、ぜひOさんと一緒

                                                          実践データサイエンス─サンプルコードと図表で学ぶ、前処理・モデル評価・パラメータチューニング - エンジニアHub|Webエンジニアのキャリアを考える!
                                                        • データサイエンティスト生活でお世話になった本|くに | 武田邦敬

                                                          みなさんこんにちは。くにです。 データ分析の世界に足を踏み入れてから9年が過ぎました。 分析実務未経験でキャリアチェンジできたのは幸運としか言えませんが、ある意味無知だったからこそ無謀な挑戦ができたのかもしれません。この挑戦の泥臭い記録は、この記事に書きました。 ポジションは変われど、データを扱う仕事をまだ続けています。 私は実務で手を動かしつつ、不格好に失敗しながら学んできました。わからないことにぶつかるたびに本を買い、その本でわからないことがあればまた本屋に行き、自分が少しでも理解できそうな本を探して買いました。そして、気になる参考文献があれば、それも買って読んでみる…。 こんな生活を続けているうちに、部屋が本だらけになってしまいました。 正直に言って読み切ったという実感のある本はありません。しかし、実務で何かしらお世話になった本は数多くあり、そういう本は手放さずに手元に置いています。

                                                            データサイエンティスト生活でお世話になった本|くに | 武田邦敬
                                                          • データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary

                                                            (2019/10/12追記 データ解析のプログラムもGitHubで公開しました) (2019/10/15追記 会員の見分け方に誤りがありました。本文中では"非会員"と"有料会員"に分けると述べていますが、正確には"非会員・無料会員"と"有料会員"に分かれています。以後の図・文章は脳内で変換していただけると幸いです。詳細は https://anond.hatelabo.jp/20191011180237 で他の方が調べてくださっています) はじめに この記事は、藍屋えん氏( @u874072e )の以下のブログに触発されて、個人的に行った一連のデータ解析をまとめたものです。 clean-copy-of-onenote.hatenablog.com 上のブログでは、食べログ3.8問題と称される問題、 「評価3.8以上の店舗は年会費を払わなければ評価を3.6に下げられる」 との説を食べログの店舗

                                                              データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary
                                                            • 「Python」×「株価データ」で学ぶデータ分析のいろは

                                                              日々変動する株価データを題材にPythonにおけるデータ分析のいろはを学んでいく本連載。最終回はローソク足とともにこれまでに計算したオシレーターなど一式を1つのグラフで表示する方法や過去の株価データを基にした株価予測の方法を解説します。

                                                                「Python」×「株価データ」で学ぶデータ分析のいろは
                                                              • 12時間でAIや機械学習の基礎を学べる人気講座が無料に | Ledge.ai

                                                                株式会社キカガクは2020年12月24日、AI(人工知能)や機械学習を学び始める人向けに、全編に解説動画が付いた「キカガク流 脱ブラックボックスコース」完全版を無料提供すると発表した。E-learningのプラットフォームであるキカガク上で受講できる。 キカガクが提供する数ある講座のうち、1番人気なのが「キカガク流 脱ブラックボックスコース」という。今回提供する完全版は、世界中でオンラインコースを提供するUdemy上で提供されている初級編(4時間)と中級編(4時間)を2020年版にブラッシュアップし、待望の声が多かった上級編を加えたもの。合計12時間でディープラーニング(深層学習)の基礎が学べるとうたう。 手書きの数学で解説 本コースの特徴は、基礎となる数学と機械学習の結びつきをバランス良く紹介していること。ディープラーニングを含めた機械学習では、微分・線形代数・確率統計の基礎を押さえてお

                                                                  12時間でAIや機械学習の基礎を学べる人気講座が無料に | Ledge.ai
                                                                • データ分析のための統計学入門.pdf

                                                                  • 無料の統計学講座が開講、多変量データの解析法を学べる | Ledge.ai

                                                                    画像は『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より オンライン講座サイト「gacco(ガッコ)」では2021年1月14日から、日本統計学会と日本行動計量学会の協力のもとに作成した「統計学Ⅲ:多変量データ解析法」が開講される。受講料は無料。 『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より 実際のデータは複数個の測定項目からなる多変量データであることが多く、そのようなデータの統計解析手法の学習は、統計手法の現実問題への応用で極めて重要なものと言える。本講座では、多変量解析法を実際のデータに適用する際の注意点や実際の応用例を中心に学習できる。 『「統計学Ⅲ:多変量データ解析法」講座PV ~ gacco:無料で学べる大学講座』より 講師は、横浜市立大学データサイエンス学部教授の岩崎学氏、大阪大学大学院人間科学研究科

                                                                      無料の統計学講座が開講、多変量データの解析法を学べる | Ledge.ai
                                                                    • タダで学べるデータサイエンス名著5冊 【日本書は高額でも英語ができれば怖くない】 - Qiita

                                                                      この時期だからこそ自学しよう 海外って太っ腹な組織が多いのか、無料で読める専門書がすごく多い。 これ系のまとめ記事は他にもありますが、 翻訳済の日本の本と、原著を並べて表示していきたいと思います。 特にデータサイエンス分野に限って紹介。 お高いあの名著も実は原著なら無料かも? (2020年5月時点) 続編、データサイエンスの名大学講座 を書きました (2020年8月) 1冊目 邦題 : 統計的学習の基礎(1万5千円) 俗に言う「カステラ本」です。 日本では2014年に翻訳されましたが、原著は2001年と今から約20年前に出版されました。 内容からしても、当時は体系的に理論学習ができる刷新的な一冊だったのでしょう。 まさに「アルゴリズム・理論の辞書」。 年代的に古い感じはしますが、基礎はいつだって大切です。 数字に強くないと絶対読み切れない。。。 原著 : The Elements of S

                                                                        タダで学べるデータサイエンス名著5冊 【日本書は高額でも英語ができれば怖くない】 - Qiita
                                                                      • 何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ

                                                                        先日、Quora日本語版でこんなやり取りがありました。 基本的にはここで述べた通りの話なのですが、折角なのでブログの方でも記事としてちょっとまとめておこうと思います。題して「何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか」というお話です。 問題意識としては毎回引き合いに出しているこちらの過去記事で論じられているような「ワナビーデータサイエンティスト」たちをどう導くべきかという議論が以前から各所であり、それらを念頭に置いています。なお毎度のことで恐縮ですが、僕も基本的には独学一本の素人ですので以下の記述に誤りや説明不足の点などあればご指摘くださると幸いです。 一般的なソフトウェア開発と、統計分析や機械学習との違い 統計分析や機械学習を仕事にするなら、その「振る舞い」を体系立てて学ぶ必要がある きちんと体系立てて学ばなかった結果として陥りがちな罠 余談

                                                                          何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ
                                                                        • 『コロナ感染マップ、誰も作らないので私が作りました』

                                                                          マスメディア報道のメソドロジーマスメディア報道の論理的誤謬(ごびゅう:logical fallacy)の分析と情報リテラシーの向上をメインのアジェンダに、できる限りココロをなくして記事を書いていきたいと思っています(笑) 緊急事態宣言が都道府県ごとに解除される中、ハッキリ言ってピントがズレているのは、専門家会議が感染者の【空間分布 spatial distribution】を定量的に把握することなく、都道府県ごとの感染者数の時間変動のみを参考にブレイン・ストーミングによって緊急事態の解除の可否を検討していることです。 緊急事態の空間的な解除を見極めるにあたって、本当に重要なことは、特定地域の感染率の空間分布の挙動が時間の経過とともにどのように変化しているかという【時空間挙動 spatio-temporal behaviors】を把握することです。また、同一都道府県内においても歴然とした【不

                                                                            『コロナ感染マップ、誰も作らないので私が作りました』
                                                                          • 異常検知入門と手法まとめ - Qiita

                                                                            異常検知について勉強したのでまとめておきます。 参考文献 下記文献を大いに参考にさせていただきました: [1] Ruff, Lukas, et al. "A Unifying Review of Deep and Shallow Anomaly Detection." arXiv preprint arXiv:2009.11732 (2020). [2] 井手. "入門 機械学習による異常検知―Rによる実践ガイド" コロナ社(2015) [3] 井手,杉山. "異常検知と変化検知 (機械学習プロフェッショナルシリーズ)" 講談社サイエンティフィク(2015) [4] 比戸. "異常検知入門" Jubatus Casual Talks #2(2013) [5] Pang, Guansong, et al. "Deep learning for anomaly detection: A rev

                                                                              異常検知入門と手法まとめ - Qiita
                                                                            • 同条件の女性と男性、女性名だと登用されにくく - 日本経済新聞

                                                                              管理職に登用する人材について、入社年数や家庭状況、意欲などの条件がまったく同じでも、上司は女性名より男性名の候補を登用しようとすることがパーソル総合研究所の調査でわかった。調査は2019年、従業員100人以上の企業でマネジメント職の登用に関わる係長級以上の男女1000人を対象にインターネットで実施した。2児を育てながら常に成績上位を維持し、会議でも積極的に発言する32歳の「小林愛さん」を「とて

                                                                                同条件の女性と男性、女性名だと登用されにくく - 日本経済新聞
                                                                              • 機械学習や統計学を「社会実装」するということ - 渋谷駅前で働くデータサイエンティストのブログ

                                                                                (Image by Pixabay) 最近になって、こんな素晴らしい資料が公開されていたことを知りました。 この資料自体は著者のMoe Uchiikeさんが東大での講義に用いられたものだとのことですが、その内容の汎用性の高さから「これは全ての機械学習や統計学を実務で用いる人々が必ず読むべきドキュメント」と言っても過言ではないと思われます。 正直言ってこの資料の完成度が高過ぎるのでこんなところで僕がああだこうだ論じるまでもないと思うので、内容の詳細については皆さんご自身でまずは上記リンクから精読していただければと思います。その上で、今回の記事では「機械学習や統計学を『社会実装』する」ということがどういうことなのかについて、この資料を下敷きとした上でさらに僕自身の経験や見聞を加えて考察したことを綴ってみます。 機械学習や統計学と、社会との「ギャップ」 機械学習や統計学を、社会に「馴染ませる」

                                                                                  機械学習や統計学を「社会実装」するということ - 渋谷駅前で働くデータサイエンティストのブログ
                                                                                • 若き統計学者の英国: いかにしてマクロ経済学はオワコンになったか

                                                                                  マクロ経済学という分野は、残念ながらもう所謂オワコンになってしまった。正しく言うと、実を言うとDSGEはもうだめです。突然こんなこと言ってごめんね。でも本当です。こんな感じだろう。 結論から言うと、データを見るふりをして実は全くデータを見ておらず、はっきりいってモデル化に失敗したからだ。とくに予測能力が兎角ないのが致命的だったと思う。予測能力がない結果、モデル・理論を通して将来の政策談義を結局は出来ないので、政策提言すらまともにできず、役立たずの烙印を押された。政策評価・提案等の役目は統計的手法を上手く用いている、応用ミクロの研究者が主に担うことになった。 そもそもの始まりは、合理的期待形成仮説というバカげた仮定に基づいて、数学音痴がmathinessにまみれたリアルビジネスサイクル(RBC)理論などという、さらにバカげた理論を推し進めた点であろう。それに呼応してニューケインジアンモデルが

                                                                                  新着記事