タグ

statisticsに関するdellab72のブックマーク (28)

  • HTMLのtableにクラスを加えるだけで、グラフやチャートを簡単に実装できるCSSのフレームワーク -Charts.css

    棒グラフや折れ線グラフ、どうやって実装していますか? Charts.cssなら簡単です。データをtableタグで実装し、CSSのクラスをtableに加えるだけで横棒グラフ、棒線グラフ、折れ線グラフ、エリアグラフなどを簡単に実装できるCSSのフレームワークを紹介します。 HTMLは普通の表組みなのでアクセシブル、グラフやチャートはレスポンシブにも完全対応した優れものです。 Charts.css Charts.css -GitHub Charts.cssの特徴 Charts.cssのデモ Charts.cssの使い方 Charts.cssの特徴 Charts.cssはtableで実装した表組みにシンプルなCSSのクラスを加えるだけで、さまざまなグラフやチャートを実装できるフレームワークです。カスタマイズも簡単で、ユーティリティのクラスも豊富に用意されています。 HTMLCSSだけで実装 セマ

    HTMLのtableにクラスを加えるだけで、グラフやチャートを簡単に実装できるCSSのフレームワーク -Charts.css
  • パイロット4000人の寸法を測って判明した「操作ミスによる墜落事故」が多発した理由とは?

    かつてアメリカ空軍は、多い日には1日に17人ものパイロットが墜落事故を起こすという問題を抱えていましたが、そこには「平均像や理想像」を追い求めることのわなが隠されていました。 When U.S. air force discovered the flaw of averages | The Star https://www.thestar.com/news/insight/2016/01/16/when-us-air-force-discovered-the-flaw-of-averages.html 1940年代後半のアメリカ空軍では、意図しない急降下や着陸時のミスから、飛行機を大破させる死亡事故まで多様な事故が発生しており、その多くは「パイロットの操縦ミス」だとされていました。なぜなら、事故が発生した機体を調べても、故障が発見されることはめったになかったからです。 しかし、単なる操作ミ

    パイロット4000人の寸法を測って判明した「操作ミスによる墜落事故」が多発した理由とは?
  • 時系列モデリングのおさらい:季節調整とトレンド抽出 - 渋谷駅前で働くデータサイエンティストのブログ

    COVID-19が世界中に感染拡大し、日含め多くの国で外出や集会の制限(自粛)措置が取られて久しい昨今ですが、これに伴って多くのところでCOVID-19に関連したオープンデータが公開されるようになっており、データ分析を生業とする人間が実データを扱う良い機会ともなっているように見受けられます。 ということで、今回の記事では東京都が公開している日次のCOVID-19感染者(PCR検査陽性者)報告数のデータを題材として、時系列モデリングのおさらいをしてみようと思います。なお、この記事における時系列モデリング結果は今後のCOVID-19の感染拡大状況について何かしらの解釈や予測をするためのものでは全くありません*1ので、悪しからずご了承ください。 また、この記事で公開しているコードは以前書いたクソコードをそのまま転用しているので、端的に言ってただのクソコードです。皆さん自身がお試しになる際は是非

    時系列モデリングのおさらい:季節調整とトレンド抽出 - 渋谷駅前で働くデータサイエンティストのブログ
  • 改めて、汎化性能と交差検証のはなし - 渋谷駅前で働くデータサイエンティストのブログ

    追記 再現性をチェックする実験を後日実施しています。併せてお読みください。 以前こんな記事を書きました。 この辺の話はとっくの昔に常識になっていると思っていたのですが、昨今様々な「モデル」が提唱されて公の場で喧伝されることが増えてきており、その中には明らかにこれらの記事で指摘されている問題に引っかかっているものがあるようなので、注意喚起も兼ねて改めてブログ記事として書いてみようと思います。 追記 (May 08, 2020) 文中にも記事公開当初の初稿の時点でいくつか但し書きを入れてありますが、この記事で最も強調したかったことは「時系列データに対して多項式フィッティングを行うという来あり得ないモデリングのやり方であっても、交差検証を行えば短期的な予測性能(汎化性能)を改善することができる」ということです。データセットにランダムウォークを選択したのは、単に極値が2つ以上ある時系列を生成し

    改めて、汎化性能と交差検証のはなし - 渋谷駅前で働くデータサイエンティストのブログ
  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
  • 【Googleデータポータル】「混合データ」の作成方法。複数のデータソースを共通するキーで統合する

    データポータル(旧データスタジオ)のレポートにおいて、複数のデータソースにあるデータをグラフなどで使いたいときは、「混合データ」の機能を利用します。「日付」や「店舗名」など、共通するキーとなる項目を使ったデータソースの統合が可能です。 コンテンツでは、無料で使えるBIツール「Googleデータポータル」(旧:Googleデータスタジオ)の使い方を連載形式で解説していきます。隔週ペースで更新予定。 連載の記事一覧 複数のデータを掛け合わせた視覚化を実現 連載も第11回となりました。前々回は「データソースの中に追加する計算フィールド」、前回は「グラフに直接追加する計算フィールド(埋め込み計算式)」と、計算で求める指標についての解説が続きました。 今回のテーマは「混合データ」です。複数のデータソースの統合方法と言い換えてもいいでしょう。 これまでは「1つのデータソース」内の項目を使って、グラフ

    【Googleデータポータル】「混合データ」の作成方法。複数のデータソースを共通するキーで統合する
  • データ分析の結果をビジネスに活かせるエンジニアになるには?『あたらしいデータサイエンスの教科書』発売

    CodeZineを運営する翔泳社では、12月17日(火)に統計学の視点からデータサイエンスについて述べ、データの活かし方を解説した『事例で学ぶ!あたらしいデータサイエンスの教科書』を発売しました。PythonやRなどを通じて統計学やデータ分析のスキルは身につけている方で、ビジネス上の課題解決や意思決定にもっとデータを役立てたいとき、書がその一助となるはずです。 『事例で学ぶ!あたらしいデータサイエンスの教科書』は、データサイエンスに興味を持つ学生や、実際に業務に携わっていてさらに分析手法を身につけたいデータサイエンティストに向けて、8つの事例をもとに適切な分析手法とデータの解釈の仕方について解説した1冊です。 データサイエンスには、ただ目の前のデータを分析をするだけでなく、その結果をどう解釈し、いかにビジネス上の目的を達成するかという視点が欠かせません。得られた結果の数値だけを報告するよ

    データ分析の結果をビジネスに活かせるエンジニアになるには?『あたらしいデータサイエンスの教科書』発売
  • データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary

    (2019/10/12追記 データ解析のプログラムもGitHubで公開しました) (2019/10/15追記 会員の見分け方に誤りがありました。文中では"非会員"と"有料会員"に分けると述べていますが、正確には"非会員・無料会員"と"有料会員"に分かれています。以後の図・文章は脳内で変換していただけると幸いです。詳細は https://anond.hatelabo.jp/20191011180237 で他の方が調べてくださっています) はじめに この記事は、藍屋えん氏( @u874072e )の以下のブログに触発されて、個人的に行った一連のデータ解析をまとめたものです。 clean-copy-of-onenote.hatenablog.com 上のブログでは、べログ3.8問題と称される問題、 「評価3.8以上の店舗は年会費を払わなければ評価を3.6に下げられる」 との説をべログの店舗

    データ解析を駆使して食べログ3.8問題が証明できなかった話 - konkon3249’s diary
  • 日本だけでない「世界的な人口減少」は不可避だ

    の人口は、2100年には今の人口の半分以下の6000万人を割りこみます。正確に言えば、5972万人にまで下がると推計されています。これは、1925(大正14)年の人口5974万人とほぼ同等に戻るということです[国立社会保障・人口問題研究所(社人研)の2019年将来人口推計による]。すでに日の人口は2011年以降8年連続の減少中でもあります。 こうした「人口減少の危機」については、メディアでもたびたび取り上げられ、そのたびに「子どもを産め」という政治家の失言がデジャヴのように繰り返されます。「少子化対策、何とかせねば」という声も湧き起こりますが、残念ながら、今さら出生率が多少改善したところで、この大きな流れは止まらないでしょう。 「平均寿命」と出生率の強い相関関係 この現象は、日だけではありません。全世界的に少子化が進みます。少子化対策について、よく「フランスを見習え」という声があが

    日本だけでない「世界的な人口減少」は不可避だ
  • 食べログ3.8問題を検証 - クイックノート

    先日、twitter上でべログの星の数について、 ある問題が話題になりました。 べログの闇として話題になったその問題とは、 「評価3.8以上は年会費を払わなければ3.6に下げられる」 というものです。 べログは飲店についての口コミを集めるサイトで、 その評価は実際のユーザーによって形成されるものとして広く認知されています。 専門的なグルメリポーターでもなく、 一般の人々の素直な感想を集めることで、 その飲店のリアルな価値が知れると期待して、 利用しているユーザーも多いでしょう。 それだけに、 「べログが評価を恣意的に操作しているかもしれない」という話は、 瞬く間にネットで話題となりました。 さて、この話は実際に行われていることなのでしょうか。 べログでは、当然評価点は公開されているので、 このような恣意的な操作があれば、 何らかの形で偏りが見つかるはずです。 ということで、

    食べログ3.8問題を検証 - クイックノート
  • Amazon.co.jp: Think clearly 最新の学術研究から導いた、よりよい人生を送るための思考法: ロルフ・ドベリ (著), 安原実津 (翻訳): 本

    Amazon.co.jp: Think clearly 最新の学術研究から導いた、よりよい人生を送るための思考法: ロルフ・ドベリ (著), 安原実津 (翻訳): 本
  • 100人から"優秀な1人"を確実に選ぶ方法 37人目までは無条件に不採用にする

    100人と順番に面接し、採用する場合は即決が条件 あなたはいま、秘書(いま風の言い方をするなら「アシスタント」と呼ぶべきなのだろうが)をひとり雇い入れたいと思っている。求人を出すと100人の女性から応募があった。あなたは無作為に順番を決めて、ひとりひとり面接をする。 面接が終わるごとに、あなたはその応募者を採用するかどうかを決めなくてはならない。翌日まで考えたり、全員の面接が終わるまで決断を先延ばしにしたりしてはならない。そして面接直後の決断を撤回することもできない。 そうだとしたら、あなたはどんなふうに「採用・不採用」を決めるだろうか? 印象のよかった最初の応募者を採用したらどうだろう? だがそうすると、一番優秀な応募者を雇いそこねる恐れがある。彼女と同じくらい優秀な、あるいはもっと優秀な女性は、応募者の中にまだたくさんいるかもしれない。 では、ひとまず95人の面接をして応募者全体の傾向

    100人から"優秀な1人"を確実に選ぶ方法 37人目までは無条件に不採用にする
  • あなたの知らない「詐欺グラフ」の世界(随時更新中)

    僕は #詐欺グラフ が何よりの大好物で、ネットやテレビで変なグラフを見かけるたびにニヤニヤしながらフォルダに保存しています。保存先のフォルダ名はズバリ「#詐欺グラフ」。 そんな詐欺グラフの世界を皆さんに共有したいと思い、筆をとりました。(2024/2/6 update) ネタ記事として、順次、ツッコミながら読んでいただければと思いますが、同僚や上司部下、取引先の「詐欺グラフ」に気づけるようにもなるため「ビジネススキルUP」にもつながるおトクな記事としても読むことができます 詐欺グラフとは詐欺グラフとは、一般的なグラフの作り方とは異なる「演出」を加えることによって意図的に錯誤を狙うグラフ のことを指しています。来、単なる羅列では直感的に理解しづらい数値等を分かりやすく表現するものがグラフであるわけですから、自分の主張を誇大に伝えるために読み手を誤解させる詐欺グラフはとても悪質なものと言える

    あなたの知らない「詐欺グラフ」の世界(随時更新中)
  • 飯田『考える技術としての統計学 生活・ビジネス・投資に生かす』 - はてなダイアリー

    飯田『考える技術としての統計学 生活・ビジネス・投資に生かす』 - はてなダイアリー
  • ベイズ統計学とは?初心者にもわかりやすく解説 |AVILEN

    ベイズ統計学とはベイズ統計学とは、ベイズの定理をもとにした統計的な考え方の一種です。 記述統計学・推計統計学とは異なる考え方をします。 ベイズ統計学が注目されている理由ベイズ統計学の基になっているベイズの定理は1700年代から存在していました。古い歴史のあるこの領域が、今再注目されている理由を解説します。 ベイズ統計学の歴史ベイズ統計学は、1700年中頃にトーマズベイズによる、ベイズの定理の発表により、産声をあげました。その後、1800年代後半に再び現在のベイズ統計の考え方の基礎となる考え方をする人々が現れました。 しかし、推計統計学論者のフィッシャーらが、「主観確率を扱うのは科学的でない」とし、ベイズ統計学は闇に葬り去られてしまったのです。 科学的であるかないかは別として、ベイズ統計学は現実に役に立つ学問であるということがが徐々に認められ、1950年代に入り再び研究され注目を浴びるように

  • 5分でスッキリ理解するベイズ推定

    ベイズ推定を学ぶモチベーション ベイズ推定は、Wikipediaに以下のように説明されています。 ベイズ推定(ベイズすいてい、英: Bayesian inference)とは、ベイズ確率の考え方に基づき、観測事象(観測された事実)から、推定したい事柄(それの起因である原因事象)を、確率的な意味で推論することを指す。 マイクロソフトのビルゲイツは自社が競争上優位にあるのはベイズ統計によると宣言したり、グーグルでは検索エンジンの自動翻訳システムでベイズ統計の技術を活かしていることが知られています。 ベイズ推定の強みは、 1. 「データが少なくても推測でき、データが多くなるほど正確になる」という性質 2. 「入ってくる情報に瞬時に反応して、自動的に推測をアップデートする」という学習機能 にあります。 これらの強みを頭に置きながら、題の「ベイズ推定とは」を見ていきます。 ベイズ推定を図で理解する

    5分でスッキリ理解するベイズ推定
  • Pythonコードと図で分かる平均値と標準偏差の違い――「統計」とはデータから価値ある情報を抜き出すこと

    Pythonコードと図で分かる平均値と標準偏差の違い――「統計」とはデータから価値ある情報を抜き出すこと:「AIエンジニアになるための「基礎数学」再入門(3)(1/2 ページ) AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回から具体的に数学を学びます。統計とは、統計量とは何かを数学記号や数式、Pythonコード、図を交えて解説します。 AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載『「AIエンジニアになるための「基礎数学」再入門』。 初回は、「AIエンジニア」になるために数学を学び直す意義や心構え、連載で学ぶ範囲についてお話ししました。また前回は、「世の中にはどのようなデータがあるのか?」という部分を主に取り上げました。今回は、「それらデータをどう活用していくのか?」「活用するために

    Pythonコードと図で分かる平均値と標準偏差の違い――「統計」とはデータから価値ある情報を抜き出すこと
  • Diagrammm. Data Visualization Grammar

    Beyound the image. Learn data visualization grammar, create stunning dataviz and impress everyone around.

    Diagrammm. Data Visualization Grammar
  • 人工知能を“正しく”疑え データサイエンティストがNHK「AIに聞いてみた」の違和感を探る (1/3) - ITmedia NEWS

    NHK総合で「AIに聞いてみた どうすんのよ!? ニッポン」の第3回が、10月13日に放送されました。テーマは「健康寿命」。3回目にしてデータサイエンス界隈からのツッコミすらなくなり、個人的には寂しい放送回となりました。皆さんはご覧になられたでしょうか? もちろん私は正座待機でした。 過去にさまざまな批判を受けたからか、番組のトーンがだいぶ変わった印象を受けました。マツコ・デラックスさんら出演者は口をそろえて「決してこれが答えではない」「スタッフが勝手に解釈して言っているだけ」と説明し、健康寿命を延ばすヒントとして挙げられた3つの提言のうち、1つはマツコさんによって却下されました。 ただし「都道府県別健康寿命×平均寿命散布図」を持ち出し、平均以下を「不健康」と表現するあたりは「来の意味の不健康から乖離(かいり)しているなぁ」と思うなど、細かいツッコミはありました。しかし、丁寧に番組を作ろ

    人工知能を“正しく”疑え データサイエンティストがNHK「AIに聞いてみた」の違和感を探る (1/3) - ITmedia NEWS
  • データ分析に不可欠の統計学をPythonで学べる!『Pythonで学ぶあたらしい統計学の教科書』発売

    Pythonで学ぶあたらしい統計学の教科書』は、統計学とPythonを基から学び、Pythonでデータを分析する方法を身につけられる「あたらしい教科書」シリーズの1冊です。 書は第1部で統計学の基を、第2部でPythonの基を説明します。そのうえで、統計学を実践的に使えるようになるためにPythonを用いた統計分析の手法を第3部で解説していきます。推計や検定などの基礎となる考え方はもちろん、正規線形モデルや一般化線形モデルといった統計モデルも紹介。 さらに第7部では既知のデータを分析する統計学から、「予測」する機能に特化した機械学習とのつながりを学んでいきます。いかにしていい予測を導き出せばいいのか、あるいは悪い予測をどうやって回避するのか、丁寧に解説します。 統計学は全体としては複雑で難しいものですが、理論と実践を一つずつ理解していけば、おのずと全体像が掴めてきます。書では日

    データ分析に不可欠の統計学をPythonで学べる!『Pythonで学ぶあたらしい統計学の教科書』発売