統計学の人気記事 283件 - はてなブックマーク

1 - 40 件 / 283件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

統計学の検索結果1 - 40 件 / 283件

統計学に関するエントリは283件あります。統計、データ、学習などが関連タグです。人気エントリには『食べログ3.8問題を検証 - クイックノート』などがあります。

食べログ3.8問題を検証 - クイックノート
- 2359 users
- clean-copy-of-onenote.hatenablog.com
- テクノロジー
- 2019/10/08
先日、twitter上で食べログの星の数について、ある問題が話題になりました。食べログの闇として話題になったその問題とは、「評価3.8以上は年会費を払わなければ3.6に下げられる」というものです。食べログは飲食店についての口コミを集めるサイトで、その評価は実際のユーザーによって形成されるものとして広く認知されています。専門的なグルメリポーターでもなく、一般の人々の素直な感想を集めることで、その飲食店のリアルな価値が知れると期待して、利用しているユーザーも多いでしょう。それだけに、「食べログが評価を恣意的に操作しているかもしれない」という話は、瞬く間にネットで話題となりました。さて、この話は実際に行われていることなのでしょうか。食べログでは、当然評価点は公開されているので、このような恣意的な操作があれば、何らかの形で偏りが見つかるはずです。ということで、食
- 統計
- 食べログ
- 検証
- あとで読む
- statistics
- webサービス
- 食
- グラフ
- クチコミ
- ネット
高等学校情報科「情報Ⅱ」教員研修用教材(本編)：文部科学省
- 2069 users
- www.mext.go.jp
- テクノロジー
- 2020/06/23
PDF形式のファイルを御覧いただく場合には、Adobe Acrobat Readerが必要な場合があります。 Adobe Acrobat Readerは開発元のWebページにて、無償でダウンロード可能です。
- 教育
- あとで読む
- 情報
- データサイエンス
- 学校
- PDF
- 科学
- 開発
- IT
- education
えるエル on Twitter: "東大が無償でPDF公開している，統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて，各事例への統計学の応用手法，3は機械学習の人なら馴染み深い統計計算を解説下手な市販の本を買うよりは，この3… https://t.co/w2cSVIxmUI"
- 1801 users
- twitter.com/ImAI_Eruel
- テクノロジー
- 2019/12/25
東大が無償でPDF公開している，統計学会の75周年記念出版『21世紀の統計科学』の3冊 1と2は実際の統計データを用いて，各事例への統計学の応用手法，3は機械学習の人なら馴染み深い統計計算を解説下手な市販の本を買うよりは，この3… https://t.co/w2cSVIxmUI
- 統計
- あとで読む
- 機械学習
- 学習
- 統計学
- pdf
- 科学
- machinelearning
- twitter
- statistics
孫さんがPCR検査を大々的にやるとツイートしたら、多くの方から医療崩壊が起こるというメッセージが来ているようですが、なぜ医療崩壊が起こるんでしょうか？に対するKenn Ejimaさんの回答 - Quora
- 1461 users
- jp.quora.com
- 暮らし
- 2020/03/16

総務省、きょうから「社会人のためのデータサイエンス入門」を無料開講 | Ledge.ai
- 1402 users
- ledge.ai
- テクノロジー
- 2022/06/07
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
- 統計
- あとで読む
- データ
- 入門
- AI
- 社会
- 分析
- 勉強
- 本
- 機械学習
ガラケーしか使えないデジタル音痴だった私が「GISでデータ分析」できるようになるまでの話｜NHK取材ノート
- 1231 users
- note.com/nhk_syuzai
- 暮らし
- 2022/03/16
東京の多摩川沿いの浸水リスクがある地域で、「なぜか人口が増えている」ことをデータ分析ソフトを使って明らかにして、その背景を探りました。次にこんな記事も書きました。南海トラフ巨大地震によって津波の浸水が想定されている区域で、高齢者の施設がすごく増えていることを示した記事です。どちらの記事も、誰もが入手できる「オープンデータ」と、後述する「GIS」という分析システムを使って隠れた事実を浮き彫りにした、データジャーナリズムのお手本などと紹介されたこともあります。そしてつい最近手がけたのがNHKスペシャル「〝津波浸水域〟の高齢者施設」。蓄積してきた分析のノウハウを注ぎ込んだ番組です。「データ分析」というと専門的で、すごく難しく思う方もいるかもしれません。しかし最初に述べたように私は数年前までは、パソコンを満足に使えない、データ分析とは無縁の「ガラケー記者」だったのです。本当に。そんな私
- データ
- あとで読む
- GIS
- NHK
- 地図
- 統計
- 分析
- 仕事
- 社会
- note
【新卒研修資料】基礎統計学 / Basic of statistics
- 1217 users
- speakerdeck.com/brainpadpr
- 政治と経済
- 2023/09/15
株式会社ブレインパッドの2023年新卒研修資料です。基礎統計学について扱っています。
- 統計
- あとで読む
- 資料
- 統計学
- 機械学習
- データ
- statistics
- 研修
- 教育
- 学習
バニラのアイスを買ったときだけ車のエンジンがかからなくなる不思議な現象、その原因は？
- 1202 users
- gigazine.net
- 暮らし
- 2020/05/11
「目に見えて明らかなことが常に解決策であるとは限らず、どれだけ不思議に見えても事実は事実に過ぎない」ということに気づかされたとして、ウォータールー大学でコンピューターサイエンスを研究するスティーブン・マン教授が不思議なエピソードを紹介しています。 Car allergic to vanilla ice cream http://www.cgl.uwaterloo.ca/smann/IceCream/humor.html ある日、自動車メーカー・ゼネラルモーターズ(GM)のポンティアック開発部に以下のような内容の苦情が寄せられました。「私がGMに苦情を書いたのはこれで2回目です。私にもおかしな話に思えるので、返事がなくても責めるつもりはありません。私たちの家族はいつも夕食後のデザートにアイスクリームを食べています。毎晩、食事後に家族全員がどの種類のアイスクリームを食べるべきかを投票し、私が
- 雑学
- GIGAZINE
- 車
- あとで読む
- 技術
- エンジニア
- ネタ
- 自動車
- アイス
- トラブル
9割の人が知らない再現性の危機 - 本しゃぶり
- 1188 users
- honeshabri.hatenablog.com
- 学び
- 2020/12/07
本で読んだ知識をドヤ顔で紹介したら、その実験には再現性がありませんでした。そんな恥ずかしい記事を書いたブロガーは誰でしょう？そう、私です。ステレオタイプ脅威はありますんちょっと前に「ステレオタイプ脅威」の記事が話題になっていた*1。世の中には「女性は数学に弱い」というような負のステレオタイプがある。自分のアイデンティティがそれに該当していると意識してしまうと、実際にパフォーマンスが落ちるというものだ。これは様々な実験の結果によって示されている。というのが記事で紹介されていた話だった。ところが現在、その「実験結果」は再現性が無いと言われている。ステレオタイプ脅威の根拠は実験結果にあるというのに、その土台は不確かなものであるのだ。とくに、最近の研究ではほとんど再現性がないとされている「ステレオタイプ脅威」について、リベラルバイアスにも言及しながら議論しているのが印象的。日本では
- 研究
- あとで読む
- 科学
- 心理
- 本
- 統計
- 考え方
- science
- 論文
- 再現性
統計学の講義資料(2022年度) | Logics of Blue
- 1141 users
- logics-of-blue.com
- 学び
- 2023/02/18
帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。目次本資料について統計学の講義資料 1．本資料について帝京大学経済学部で用いた講義資料です。 2022年度の統計学I及び統計学IIの講義スライドを編集したうえでUPしています。もとの講義資料とは異なる点もあるのでご注意ください。万が一何か問題があれば、当ブログにコメントをいただけますと幸いです。スライドにも記載の通り、以下の利用を想定しています。想定①：講義の受講者が復習に利用する想定②：未受講者が統計学入門資料として利用する基本的には想定①ですが、文系の学生をメインターゲットとした統計学の本格的入門資料は少ない印象です。未受講者の方にも役に立つかもしれないと思いWeb上で公開することにしました。本資料は1年間にわたる講義資料となっています。数回
- 統計
- あとで読む
- 統計学
- 資料
- 勉強
- 入門
- 講義
- データ
- 学習
- 機械学習
統計の入門講座が無料に、京大メソッドでデータサイエンス関連教員が担当 | Ledge.ai
- 1103 users
- ledge.ai
- テクノロジー
- 2021/09/12
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
- 統計
- あとで読む
- 入門
- 教育
- データ
- 学習
- データサイエンス
- 研究
- AI
- 勉強
まあ、なんちゅうか、トラバも盛大に伸びているので、私の書くここまで、..
- 1058 users
- anond.hatelabo.jp
- 学び
- 2022/01/22
まあ、なんちゅうか、トラバも盛大に伸びているので、私の書くここまで、元増田は辿り着かないかもしれませんが・・・私はゲノム科学者ですが、元増田の持つ疑問は、別に自然なものだと思うんですよね。というより、ゲノム配列決定が非常に身近になっている昨今、ちゃんと向き合っていかなければならない疑問だと思っています。私は私の持つ知識の範囲で、疑問にお答えしたいと思います。倫理は専門外なので扱いません。タブーとか扱いません。裏の意図を読もうとしているブコメが多数ありましたが、理系なのでよくわかりません。まず、元増田の挙げているような、運動能力、将棋の能力、見た目の美醜とか、学歴、といったヒト個人ごとに異なる特徴を「形質」と言います。形質を遺伝学の観点から見ると大きく分けて二つあり、単一遺伝子型（メンデル型）と多遺伝子型（多因子型）です。おそらく優生学にせよ遺伝にせよ、専門外の人が通常頭に思い浮かべる
- 増田
- 科学
- 生物
- あとで読む
- 遺伝
- 優生学
- science
- 遺伝子
- 性
- 社会
『データ分析のための統計学入門』PDFが無料公開データサイエンティストたちが執筆 | Ledge.ai
- 1021 users
- ledge.ai
- テクノロジー
- 2021/04/08
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
- 統計
- あとで読む
- データ
- 入門
- AI
- 勉強
- pdf
- 数学
- 分析
- データ分析
食べログ3.8問題に終止符を打つ
- 1000 users
- nbviewer.jupyter.org
- 暮らし
- 2019/10/15
import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import json import glob import math from pathlib import Path from collections import Counter from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix from sklearn.metrics import roc_auc_score from sklearn.model_selection imp
- 食べログ
- 統計
- あとで読む
- python
- statistics
- food
- 資料
- tabelog
- 統計学
- matplotlib
Google が公開している、より良いデータ分析のためのガイドブック「Good Data Analysis」で、データ分析の要所が簡潔にまとめられていて感動した
- 955 users
- shunyaueta.com
- テクノロジー
- 2022/03/08
Google が公開している、より良いデータ分析のためのガイドブック「Good Data Analysis」で、データ分析の要所が簡潔にまとめられていて感動した 2022-03-08 Google の非公式ブログで、The Unofficial Google Data Science Blog というデータサイエンスをテーマにしたブログがある。その中で、 Practical advice for analysis of large, complex data sets の記事を元にして作られた Google Developers Guides: Machine Learning Guides > Good Data Analysis を昨日見かけて読んでいたら素晴らしいドキュメントだったので、ここでその感動を共有したかったので筆をとったしだい。 Good Data Analysis の概
数学とプログラミングの勉強を開始して、何度も挫折して今に至る軌跡を晒す
- 932 users
- anond.hatelabo.jp
- 学び
- 2021/12/04
2013年の秋、その時の自分は30代前半だった。衝動的に数学を学び直すことにした。若くないし、数学を学びなおすには遅すぎると思って尻ごみしていたが、そこを一念発起。というか軽い気持ちで。ぶっちゃけると分散分析とやらに興味を持ったから。数学というか統計かな。統計的に有意差があったといわれてもその意味がさっぱりだった。一応、理系の大学を出てるので、有意差という単語をちょいちょい耳にはしていたが、「よくわかんないけどt検定とかいうやつやっとけばいいんでしょ？」くらいの理解だった。で、ありがちな多重比較の例で、3群以上の比較にt検定は使っちゃダメだよっていう話を聞いて、なんか自分だけ置いてけぼりが悔しくなって、Amazonをポチッとしたのが全ての始まり。あと、あの頃はライン作業の工員だったから、脳が疲れてなかったし。そんなわけで、自分の軌跡を晒してみる。みんな数学とかプログ
- 数学
- あとで読む
- 勉強
- プログラミング
- 増田
- 学習
- 統計
- math
- excel
- programming
【Python】専門書や論文を読みたいけど数学が苦手・わからない人向けのコードを読んで学ぶ数学教本 - Qiita
- 924 users
- qiita.com/PHVTuber
- テクノロジー
- 2021/10/24
はじめにプログラミング自体は文系、理系、年齢関わらず勉強すればある程度ものになります。プログラミングがある程度できるようになるとTensorflow,PyTorchやscikit-learn等のライブラリで簡単にできる機械学習やデータサイエンスに興味を持つの必然! これからさらになぜ上手くいくのか・いかないのかの議論をしたい、社内・外に発表したい、理論的な所を理解したい、先端研究を取り入れたい、応用したい等々と次々に実現したい事が増えるのもまた必然でしょう。このときに初めて数学的なバックグラウンドの有無という大きな壁が立ちはだかります。しかし、数学は手段であって目的ではないので自習に使える時間をあまり割きたくないですよね。また、そもそも何から手を付けたら良いかわからないって人もいるかと思います。そんな人に向けた記事です。本記事の目標は式の意図する事はわからんが、仕組みはわかるという状態に
- 数学
- python
- あとで読む
- 学習
- プログラミング
- 勉強
- コード
- math
- qiita
- 教育
「月曜日のたわわ」を人々はどう見るか/田中辰雄 - SYNODOS
- 852 users
- synodos.jp
- 世の中
- 2022/04/20
1．はじめに日経新聞に載った「月曜日のたわわ」の広告は波紋を呼んだ。「月曜日のたわわ」は青年漫画誌の連載漫画であり、その漫画のキャラを使った広告が不適切であるとして批判されたのである。批判の趣旨は、広告で描かれた絵は女子高生を性的に扱っており、新聞の広告として不適切という点にある。これに対し、表現の自由で許される範囲であるという反論がなされ、活発な論争が起きている。これに類似の論争はこれまでに何度も繰り返されてきた。古くは、人工知能学会表紙事件（2014年）、新しくは宇崎ちゃん献血ポスター事件（2019年）、そして直近では温泉むすめの事件（2020年）が記憶に新しい。これらの論争では、人々がその表現をどう受け取るかが争点の一つである。しかし、騒動の渦中に人々がその表現をどう受け取っているかが調べられた例は多くはない。本稿ではこれを試みる。この広告に対して批判する意見、容認する意見はど
- 統計
- 広告
- 表現の自由
- 漫画
- 表現
- あとで読む
- 社会
- 表現規制
- ジェンダー
- gender
統計の入門
- 832 users
- lms.gacco.org
- 学び
- 2021/09/12
この講座は『受講登録する（無料）』ボタンを押すと受講開始となる『開始日可変型講座』です。『開始日可変型講座』とは、受講者個々の受講開始日に応じて進行する講座です。ご自身のスケジュールは、以下の講座スケジュール（PDF）を参考にご確認ください。講座内容統計に関する知識は、実験、試験、調査などの結果を用いた実証研究を行う上でなくてはならないものである。生活に関わるさまざまな効果やリスクがデータとともに語られ、生活者としても統計に対するリテラシーが求められるようになった。企業活動では、情報技術の発展によって、日々膨大なデータが生成されており、その活用が求められるようになった。本講座は、研究や、生活、社会・経済活動に不可欠な統計を、集計・分析し、理解する力を養うことを目的とした「統計入門」「続統計入門」を圧縮した内容になっている。これから統計を学ぼうとする初学者や、学び直しを目指す学生を主
- 統計
- あとで読む
- 学習
- 入門
- 勉強
- 研究
- 本
- 統計学
- 講義
- statistics
線形代数を学ぶ理由 - Qiita
- 816 users
- qiita.com/kaityo256
- 学び
- 2019/05/09
はじめに少し前(2019年4月頃)に、「AI人材」という言葉がニュースを賑わせていました。「現在流行っているディープラーニングその他を使いこなせる人材」くらいの意味だと思いますが、こういうバズワードの例の漏れず、人によって意味が異なるようです。併せて「AI人材のために線形代数の教育をどうするか」ということも話題になっています。線形代数という学問は、本来は極めて広く、かつ強力な分野ですが、とりあえずは「行列とベクトルの性質を調べる学問」と思っておけば良いです。理工系の大学生は、まず基礎解析とともに線形代数を学ぶと思います。そして、何に使うのかわからないまま「固有値」や「行列式」などの概念が出てきて、例えば試験で3行3列の行列の固有値、固有ベクトルを求め、4行4列の行列の行列式を求めたりしてイヤになって、そのまま身につかずに卒業してしまい、後で必要になって後悔する人が出てきたりします(例え
- 数学
- 線形代数
- あとで読む
- math
- AI
- 勉強
- Qiita
- mathematics
- 学問
- python
もうなんか間違ったことしか書いてなくて増田が何でこんなもの書こうと思..
- 765 users
- anond.hatelabo.jp
- 学び
- 2022/01/25
もうなんか間違ったことしか書いてなくて増田が何でこんなもの書こうと思ったのかちょっと意味が分からないんだけど一応気になったところだけ訂正・説明を入れておく。（ほぼ全文にわたっているが…）途中で「なんでこんな中間テストの採点みたいなことやってんの…」みたいな気分になったけど万が一これを読んで本気にしている人がいるといけないので義務感で最後まで書きました。あまりの衝撃に最初からテンション高いですけどね。もう疲れたからこのまま上げます。なんなんやいったい... 遺伝病の断種は、遺伝病の根絶について特に有効ではないと考えられています。まず、潜性遺伝病の場合はどうでしょうか。これは、両方の染色体に、多くは遺伝子機能欠失型の遺伝子変異があると起こります。親は、片方しか持っていなければ健康なのですね。すると、両方の遺伝子変異を持つ遺伝病患者を断種させたところで、片方だけを持つ親が世の中にたくさ
コロナウイルスなどのアウトブレイクは、なぜ急速に拡大し、どのように「曲線を平らにする」ことができるのか
- 762 users
- www.washingtonpost.com
- 世の中
- 2020/03/19
ワシントン・ポストでは、全ての読者がコロナウイルスに関する重要な情報へアクセスすることができるよう、この情報を無料で提供しています。無料講読を希望される方は、当社のデイリーコロナウイルスアップデートニュースレターへご登録ください。 COVID-19による感染が初めて確認され、この新型コロナウイルスによる感染症についてアメリカ国内でも公表されたが、さらなる感染については、ぽたぽたと滴り落ちるように、なかなか報告されていなかった。それから2ヶ月が経ち、その滴りはゆるぎない潮となって押し寄せてきたのである。 [Read this story in English] このいわゆる指数曲線は、専門家の間で懸念の原因となっている。もし感染者が3日ごとに2倍に増加するとなると、5月にはアメリカ国内での感染者が1億人ほどにまでのぼるであろう。これは計算から導き出した数字であって、予言ではない。公衆衛生の
東京の感染者数を5週間ぶん予測した (7月5日版)
- 736 users
- anond.hatelabo.jp
- 世の中
- 2021/07/05
(※ 新しい予測を公開しました→ 東京の感染者数を5週間ぶん予測した (7月12日版)) 東京の感染者数を5週間ぶん予測した (6月21日版)、(6月28日版) の続き。まえがきは初回(6月21日版)の記事でご覧ください。先週の予測は、日曜までの週単位で 4679人(6月21日版)、4502人(6月28日版) でしたが、現実は 4074人となりました。少し下振れしたのでそれに合わせて今後の予想も下振れしますが、必ずしもこれから毎週累積で下振れしていくというわけではなく、週単位ではあくまで上下ともにブレる可能性が半々になるように予測しています。また、前回の記事で書いた上振れの時と逆ですが、下振れした週の感染者数は都民をそれほど緊張させず、3週後のブレーキが弱くなるため、やはり全体としての影響は限定的になります。下振れのいちばん大きな要因は、人流データによるものでした。というのも、予測に
新卒向け「統計学の基礎」100ページ超　SaaS企業が無料で資料公開
- 704 users
- www.itmedia.co.jp
- テクノロジー
- 2023/09/20
資料では、統計学がどんな学問なのか、統計学を学ぶことにどんな意義があるのかという初歩から解説。その上で統計学を「記述統計学」と「推計統計学」に大別し、それぞれの特徴や手法、注意点を説明している。今回の無料公開は、ブレインパッドで働く有志のデータサイエンティストが技術資料などを外部に発信するプロジェクト「OpenBrainPad」の一環。「統計学をこれから学ぶ人も復習する人もぜひ利用してほしい」（ブレインパッド）という。同プロジェクトでは、過去にはプログラムのバージョンを管理するシステム「Git」のハンズオン（実際に手を動かして学ぶ）資料なども公開している。関連記事総務省「誰でも使える統計オープンデータ」無料オンライン講座スタート総務省が「誰でも使える統計オープンデータ」を開講。統計オープンデータを活用したデータ分析の手法を解説する無料講座だ。 AIの基礎をZoomで講義　新人研修用
- 統計
- あとで読む
- 資料
- 学習
- 統計学
- AI
- 研修
- データ
- 勉強
- 画像
『鬼滅の刃』大ヒットの理由が見つかることは無い - 本しゃぶり
- 704 users
- honeshabri.hatenablog.com
- アニメとゲーム
- 2020/11/16
誰もが知りたい『鬼滅の刃』大ヒットの理由。これはどれほど丹念に作品と向き合っても答えは得られない。なぜなら人の繋がりから生じる偶然の結果だからだ。なぜ大ヒットしたのかという疑問この『鬼滅の刃』解説記事に対する反応が興味深い。このnoteは『鬼滅の刃』の導入を解説したものだ。どうやって読者を1ページ目から引き込むか、その「技術」と「困難」について書かれている。これに対し、ブコメはほぼ批判一色となった。書いてある内容は決して間違っていないし、かなり細かく説明されている。なのになぜ批判が多いのか。コメントの内容は主に以下の2点となる。『鬼滅の刃』に限った話ではない長い先に後者についてだが、「長い」ということは必ずしも悪ではない。スクロールバーが点になるような記事でも、好意的なコメントが多いこともある。結局のところ「長い」という批判が意味することは、自分の知りたいことが書かれてい
- 漫画
- 社会
- あとで読む
- 本
- 文化
- 鬼滅の刃
- マーケティング
- 考え方
- マンガ
- アニメ
WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times
- 641 users
- paiza.hatenablog.com
- テクノロジー
- 2019/10/16
主な確率分布の関連図こんにちは、吉岡（@yoshiokatsuneo）です。 Webサービスを運営していると、利用状況を分析・予測したり、A/Bテストなどで検証したりすることがよくあります。データを一個一個見ていてもよくわからないので、データ全体や、その背景の傾向などがまとめて見られると便利ですよね。そんなとき、データの様子を表現するためによく使われているのが「確率分布」です。学校の試験などで使われる偏差値も、得点を正規分布でモデル化して、点数を変換したものです。今回は、Webサービスなどでよく使われる確率分布18種類を紹介します。それぞれ、Webサービスでの利用例やPythonでグラフを書く方法も含めて説明していきます。コードは実際にオンライン実行環境paiza.IOで実行してみることができますので、ぜひ試してみてください。【目次】正規分布対数正規分布離散一様分布連続
- 機械学習
- あとで読む
- 確率分布
- 統計
- 学習
- 開発
- 確率
- テスト
- サービス
- web
実践データサイエンス─サンプルコードと図表で学ぶ、前処理・モデル評価・パラメータチューニング - エンジニアHub｜Webエンジニアのキャリアを考える！
- 629 users
- eh-career.com
- テクノロジー
- 2019/09/10
実践データサイエンス─サンプルコードと図表で学ぶ、前処理・モデル評価・パラメータチューニング実践とともに、データサイエンスに入門しよう！敷居が高いと思われがちなデータサイエンスですが、データの前処理からの手順は意外とシンプルです。本記事では、データの前処理や特徴量の作成、モデルの評価・訓練、ハイパーパラメータの調整など、基本的な知識をサンプルコードと図表を見ながら学びます。データサイエンティストとしてのスキルを向上させるには、データの前処理や特徴量の作成、モデルの評価・訓練、ハイパーパラメータの調整など、広域にわたる知識を身に付ける必要があります。この記事は、そうした知識を「サンプルコードと図表を見ながら、分かりやすく学習できること」を目指して作成されました。記事内では、新米データサイエンティストのOさんが登場して、ある案件のデータ分析を担当します。読者のみなさんも、ぜひOさんと一緒
データサイエンティスト生活でお世話になった本｜くに | 武田邦敬
- 602 users
- note.com/ku2t
- 学び
- 2020/08/15
みなさんこんにちは。くにです。データ分析の世界に足を踏み入れてから9年が過ぎました。分析実務未経験でキャリアチェンジできたのは幸運としか言えませんが、ある意味無知だったからこそ無謀な挑戦ができたのかもしれません。この挑戦の泥臭い記録は、この記事に書きました。ポジションは変われど、データを扱う仕事をまだ続けています。私は実務で手を動かしつつ、不格好に失敗しながら学んできました。わからないことにぶつかるたびに本を買い、その本でわからないことがあればまた本屋に行き、自分が少しでも理解できそうな本を探して買いました。そして、気になる参考文献があれば、それも買って読んでみる…。こんな生活を続けているうちに、部屋が本だらけになってしまいました。正直に言って読み切ったという実感のある本はありません。しかし、実務で何かしらお世話になった本は数多くあり、そういう本は手放さずに手元に置いています。
- データサイエンス
- あとで読む
- 本
- 統計
- 機械学習
- データ分析
- データ
- 分析
- book
- 書籍
データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary
- 599 users
- konkon3249.hatenablog.com
- 世の中
- 2019/10/10
(2019/10/12追記データ解析のプログラムもGitHubで公開しました) (2019/10/15追記会員の見分け方に誤りがありました。本文中では"非会員"と"有料会員"に分けると述べていますが、正確には"非会員・無料会員"と"有料会員"に分かれています。以後の図・文章は脳内で変換していただけると幸いです。詳細は https://anond.hatelabo.jp/20191011180237 で他の方が調べてくださっています) はじめにこの記事は、藍屋えん氏( @u874072e )の以下のブログに触発されて、個人的に行った一連のデータ解析をまとめたものです。 clean-copy-of-onenote.hatenablog.com 上のブログでは、食べログ3.8問題と称される問題、「評価3.8以上の店舗は年会費を払わなければ評価を3.6に下げられる」との説を食べログの店舗
「Python」×「株価データ」で学ぶデータ分析のいろは
- 599 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2021/09/28
日々変動する株価データを題材にPythonにおけるデータ分析のいろはを学んでいく本連載。最終回はローソク足とともにこれまでに計算したオシレーターなど一式を1つのグラフで表示する方法や過去の株価データを基にした株価予測の方法を解説します。
- python
- あとで読む
- 投資
- データ
- 統計
- 分析
- 株
- プログラミング
- 勉強
- 本
12時間でAIや機械学習の基礎を学べる人気講座が無料に | Ledge.ai
- 598 users
- ledge.ai
- テクノロジー
- 2020/12/30
株式会社キカガクは2020年12月24日、AI（人工知能）や機械学習を学び始める人向けに、全編に解説動画が付いた「キカガク流脱ブラックボックスコース」完全版を無料提供すると発表した。E-learningのプラットフォームであるキカガク上で受講できる。キカガクが提供する数ある講座のうち、1番人気なのが「キカガク流脱ブラックボックスコース」という。今回提供する完全版は、世界中でオンラインコースを提供するUdemy上で提供されている初級編（4時間）と中級編（4時間）を2020年版にブラッシュアップし、待望の声が多かった上級編を加えたもの。合計12時間でディープラーニング（深層学習）の基礎が学べるとうたう。手書きの数学で解説本コースの特徴は、基礎となる数学と機械学習の結びつきをバランス良く紹介していること。ディープラーニングを含めた機械学習では、微分・線形代数・確率統計の基礎を押さえてお
データ分析のための統計学入門.pdf
- 568 users
- www.kunitomo-lab.sakura.ne.jp
- テクノロジー
- 2021/04/06
- 統計
- 統計学
- あとで読む
- pdf
- データ分析
- 学習
- statistics
- 入門
- 数学
- データ
無料の統計学講座が開講、多変量データの解析法を学べる | Ledge.ai
- 549 users
- ledge.ai
- テクノロジー
- 2021/01/14
画像は『「統計学Ⅲ:多変量データ解析法」講座PV ～ gacco：無料で学べる大学講座』よりオンライン講座サイト「gacco（ガッコ）」では2021年1月14日から、日本統計学会と日本行動計量学会の協力のもとに作成した「統計学Ⅲ:多変量データ解析法」が開講される。受講料は無料。『「統計学Ⅲ:多変量データ解析法」講座PV ～ gacco：無料で学べる大学講座』より実際のデータは複数個の測定項目からなる多変量データであることが多く、そのようなデータの統計解析手法の学習は、統計手法の現実問題への応用で極めて重要なものと言える。本講座では、多変量解析法を実際のデータに適用する際の注意点や実際の応用例を中心に学習できる。『「統計学Ⅲ:多変量データ解析法」講座PV ～ gacco：無料で学べる大学講座』より講師は、横浜市立大学データサイエンス学部教授の岩崎学氏、大阪大学大学院人間科学研究科
- 統計
- あとで読む
- 学習
- データ
- 無料
- 勉強
- 数学
- 大学
- statistics
- 機械学習
タダで学べるデータサイエンス名著5冊【日本書は高額でも英語ができれば怖くない】 - Qiita
- 539 users
- qiita.com/Ringa_hyj
- テクノロジー
- 2020/05/07
この時期だからこそ自学しよう海外って太っ腹な組織が多いのか、無料で読める専門書がすごく多い。これ系のまとめ記事は他にもありますが、翻訳済の日本の本と、原著を並べて表示していきたいと思います。特にデータサイエンス分野に限って紹介。お高いあの名著も実は原著なら無料かも？ (2020年5月時点) 続編、データサイエンスの名大学講座を書きました (2020年8月) 1冊目邦題 : 統計的学習の基礎(1万5千円) 俗に言う「カステラ本」です。日本では2014年に翻訳されましたが、原著は2001年と今から約20年前に出版されました。内容からしても、当時は体系的に理論学習ができる刷新的な一冊だったのでしょう。まさに「アルゴリズム・理論の辞書」。年代的に古い感じはしますが、基礎はいつだって大切です。数字に強くないと絶対読み切れない。。。原著 : The Elements of S
- データサイエンス
- あとで読む
- 本
- 学習
- 統計
- データ
- 機械学習
- pdf
- 統計学
- ML
何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ
- 527 users
- tjo.hatenablog.com
- テクノロジー
- 2021/05/14
先日、Quora日本語版でこんなやり取りがありました。基本的にはここで述べた通りの話なのですが、折角なのでブログの方でも記事としてちょっとまとめておこうと思います。題して「何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか」というお話です。問題意識としては毎回引き合いに出しているこちらの過去記事で論じられているような「ワナビーデータサイエンティスト」たちをどう導くべきかという議論が以前から各所であり、それらを念頭に置いています。なお毎度のことで恐縮ですが、僕も基本的には独学一本の素人ですので以下の記述に誤りや説明不足の点などあればご指摘くださると幸いです。一般的なソフトウェア開発と、統計分析や機械学習との違い統計分析や機械学習を仕事にするなら、その「振る舞い」を体系立てて学ぶ必要があるきちんと体系立てて学ばなかった結果として陥りがちな罠余談
『コロナ感染マップ、誰も作らないので私が作りました』
- 487 users
- ameblo.jp/kazue-fgeewara
- 世の中
- 2020/05/19
マスメディア報道のメソドロジーマスメディア報道の論理的誤謬（ごびゅう：logical fallacy）の分析と情報リテラシーの向上をメインのアジェンダに、できる限りココロをなくして記事を書いていきたいと思っています（笑）緊急事態宣言が都道府県ごとに解除される中、ハッキリ言ってピントがズレているのは、専門家会議が感染者の【空間分布 spatial distribution】を定量的に把握することなく、都道府県ごとの感染者数の時間変動のみを参考にブレイン・ストーミングによって緊急事態の解除の可否を検討していることです。緊急事態の空間的な解除を見極めるにあたって、本当に重要なことは、特定地域の感染率の空間分布の挙動が時間の経過とともにどのように変化しているかという【時空間挙動 spatio-temporal behaviors】を把握することです。また、同一都道府県内においても歴然とした【不
- COVID-19
- 統計
- 可視化
- データ
- あとで読む
- コロナウィルス
- 大阪
- statistics
- 報道
- コロナ
異常検知入門と手法まとめ - Qiita
- 487 users
- qiita.com/kyohashi
- テクノロジー
- 2020/11/24
異常検知について勉強したのでまとめておきます。参考文献下記文献を大いに参考にさせていただきました： [1] Ruff, Lukas, et al. "A Unifying Review of Deep and Shallow Anomaly Detection." arXiv preprint arXiv:2009.11732 (2020). [2] 井手. "入門機械学習による異常検知―Rによる実践ガイド" コロナ社(2015) [3] 井手,杉山. "異常検知と変化検知 (機械学習プロフェッショナルシリーズ)" 講談社サイエンティフィク(2015) [4] 比戸. "異常検知入門" Jubatus Casual Talks #2(2013) [5] Pang, Guansong, et al. "Deep learning for anomaly detection: A rev
同条件の女性と男性、女性名だと登用されにくく - 日本経済新聞
- 476 users
- www.nikkei.com
- 世の中
- 2021/03/27
管理職に登用する人材について、入社年数や家庭状況、意欲などの条件がまったく同じでも、上司は女性名より男性名の候補を登用しようとすることがパーソル総合研究所の調査でわかった。調査は2019年、従業員100人以上の企業でマネジメント職の登用に関わる係長級以上の男女1000人を対象にインターネットで実施した。2児を育てながら常に成績上位を維持し、会議でも積極的に発言する32歳の「小林愛さん」を「とて
- ジェンダー
- 差別
- 労働
- あとで読む
- 社会
- 男女
- gender
- 採用
- 就職
- 日本
機械学習や統計学を「社会実装」するということ - 渋谷駅前で働くデータサイエンティストのブログ
- 468 users
- tjo.hatenablog.com
- テクノロジー
- 2020/07/15
(Image by Pixabay) 最近になって、こんな素晴らしい資料が公開されていたことを知りました。この資料自体は著者のMoe Uchiikeさんが東大での講義に用いられたものだとのことですが、その内容の汎用性の高さから「これは全ての機械学習や統計学を実務で用いる人々が必ず読むべきドキュメント」と言っても過言ではないと思われます。正直言ってこの資料の完成度が高過ぎるのでこんなところで僕がああだこうだ論じるまでもないと思うので、内容の詳細については皆さんご自身でまずは上記リンクから精読していただければと思います。その上で、今回の記事では「機械学習や統計学を『社会実装』する」ということがどういうことなのかについて、この資料を下敷きとした上でさらに僕自身の経験や見聞を加えて考察したことを綴ってみます。機械学習や統計学と、社会との「ギャップ」機械学習や統計学を、社会に「馴染ませる」
若き統計学者の英国: いかにしてマクロ経済学はオワコンになったか
- 451 users
- benthestatistics.blogspot.com
- 学び
- 2020/06/10
マクロ経済学という分野は、残念ながらもう所謂オワコンになってしまった。正しく言うと、実を言うとDSGEはもうだめです。突然こんなこと言ってごめんね。でも本当です。こんな感じだろう。結論から言うと、データを見るふりをして実は全くデータを見ておらず、はっきりいってモデル化に失敗したからだ。とくに予測能力が兎角ないのが致命的だったと思う。予測能力がない結果、モデル・理論を通して将来の政策談義を結局は出来ないので、政策提言すらまともにできず、役立たずの烙印を押された。政策評価・提案等の役目は統計的手法を上手く用いている、応用ミクロの研究者が主に担うことになった。そもそもの始まりは、合理的期待形成仮説というバカげた仮定に基づいて、数学音痴がmathinessにまみれたリアルビジネスサイクル(RBC)理論などという、さらにバカげた理論を推し進めた点であろう。それに呼応してニューケインジアンモデルが
- 経済学
- 統計
- あとで読む
- 経済
- economics
- 科学哲学
- economy
- math