タグ

統計に関するING40のブックマーク (15)

  • 改訂増補版:統計検定を理解せずに使っている人のために I

    © 2019 Japan Society for Bioscience, Biotechnology, and Agrochemistry © 2019 公益社団法人日農芸化学会 改訂増補にあたってこの総説は,「統計検定を理解せずに使っている人のために I」の改訂増補版である.今後,「II」および「III」も改訂増補する.これら三部作は2013年に出版されたが,最近でもJ-STAGEでの「化学と生物」の論文アクセスランキングで常に上位を占めている.しかし,これら三部作には正しくない記載や,言葉足らずでわかりにくい内容があった.そこで,誤りを修正し,内容をさらに充実しわかりやすくするため,改訂することとなった.間違いのあった理由は,筆者の統計に対する理解不足にほかならない.筆者は統計学が専門ではない.来このような学術雑誌には専門家が執筆すべきと考えるが,専門家による総説や専門書は,往々に

    ING40
    ING40 2023/03/08
  • データ分析のための統計学入門.pdf

  • 何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ

    先日、Quora日語版でこんなやり取りがありました。 基的にはここで述べた通りの話なのですが、折角なのでブログの方でも記事としてちょっとまとめておこうと思います。題して「何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか」というお話です。 問題意識としては毎回引き合いに出しているこちらの過去記事で論じられているような「ワナビーデータサイエンティスト」たちをどう導くべきかという議論が以前から各所であり、それらを念頭に置いています。なお毎度のことで恐縮ですが、僕も基的には独学一の素人ですので以下の記述に誤りや説明不足の点などあればご指摘くださると幸いです。 一般的なソフトウェア開発と、統計分析や機械学習との違い 統計分析や機械学習仕事にするなら、その「振る舞い」を体系立てて学ぶ必要がある きちんと体系立てて学ばなかった結果として陥りがちな罠 余談

    何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ
  • 統計的声質変換 (1) ロードマップ - 人工知能に関する断創録

    Pythonで音声信号処理(2011/5/14)のつづき。 @r9y9さんの以下のチュートリアル記事をきっかけに興味をもった統計的声質変換の実験をしてみたい。統計的声質変換とはAさんの声を別のBさんの声に変換する技術のこと。 統計的声質変換クッソムズすぎワロタ(チュートリアル編) - LESS IS MORE 「統計的」という名前からわかるように今回対象としているのはデータに基づいた声質変換である。簡単に手順をまとめると、 変換元のAさんと変換先のBさんの音声データを用意する この音声データを学習データとしてAさんの声をBさんの声に変換する統計モデルを学習する Aさんの任意の音声を統計モデルに入力するとBさんの声になって出てくる という感じ。コナンの声が毛利小五郎の声になって出てくるという例の蝶ネクタイ型マイクの背景技術である。あのマイクの中にはコナンの声を毛利小五郎の声に変換する何らかの

    統計的声質変換 (1) ロードマップ - 人工知能に関する断創録
  • 総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス演習

    第1週:データサイエンスとは ・データサイエンスの発展 ・社会で起きている変化~データサイエンスの必要性~ ・データサイエンスに求められるスキルや知識 ・データサイエンスの未来と発展 ・データサイエンスのサイクルと課題解決の進め方 ・分析の手法の選択 第2週:分析の概念と事例 ~ビジネス課題解決のためのデータ分析基礎 (事例と手法)(1)~ ・Analysis(分析)とは ・1変数の状況の把握(1)(可視化の活用) ・1変数の状況の把握(2)(代表値の活用) ・比較して2変数の関係を見る ・ビジネスにおける比較(1)(概要) ・ビジネスにおける比較(2)(適切なA/Bテストの活用) 第3週:分析の具体的手法 ~ビジネス課題解決のためのデータ分析基礎 (事例と手法)(2)~ ・クロス集計の軸設定と見方 ・散布図と相関の調べ方 ・相関関係と因果関係の違い ・時系列データの見方 ・時系列データの

    総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス演習
  • 「5%の確率で性器を露出するドラえもん」の消滅(と復活) - 僕秩はてな

    ついにその時が来た。 「5%の確率で性器を露出するドラえもん」が消滅したのだ。 知らない方のために説明すると、「5%の確率で性器を露出するドラえもん」とは、二時間に一回ランダムでドラえもんのひみつ道具をつぶやく人気のTwitterBOTだ。 通常は「どこでもドア」「タケコプター」等、普通の道具をつぶやいているのだが、名前の通り5%の確率でひみつ道具ではなく「チンポ(ボロン」とつぶやくのがミソである。 初めは数千人のフォロワーの時期が長かったが、ある時期からこんな噂が広がるようになった。 「5%の確率で性器を露出するドラえもん」がチンポを出した時に、ソーシャルゲームのガチャを引いたら、超レアなカードが出た と。 それ以降、ソシャゲのレアカードを求めた人が殺到し、ドラえもんの出す道具に多くの注目が集まるようになった。 5%の確率でチンポが出た時は、瞬時に10000回以上のRTがされ、多くの人

    「5%の確率で性器を露出するドラえもん」の消滅(と復活) - 僕秩はてな
  • [艦これ][大型艦建造] 建造率の推定 大鳳レシピ3600/2000/5300/5200 大和レシピ4010/5000/6000/2500:びいかめのブロマガ - ブロマガ

    回帰分析を用いて、大型艦建造における建造率の推定を行いました。あくまで推定なので実際の確率とは異なる場合があります。参考程度にどうぞ。サンプルとしてしたらばにある艦これ専用掲示板の【報告】大型艦/新型艦建造スレ25【検証】 - 艦これ専用掲示板にて報告された39855件のデータを使用しました。 したらばにて報告のあった1187種類のレシピを、確率が大きく変わらないと推定された、いくつかのグループにまとめ、その中でもっとも資源投入量の少ないレシピの結果として併合しています。レシピごとの報告数が少なくても、グループごとに報告をまとめることで精度を高めています。見たいレシピが表に載っていない場合は、それよりも投入量の少ないレシピを参照してください。 表中にある95%CIとは95%信頼区間の略で、実際の建造率は95%の確率でこの区間の中に納まっていると推定されています。 今回の推定では、開発資材・

    [艦これ][大型艦建造] 建造率の推定 大鳳レシピ3600/2000/5300/5200 大和レシピ4010/5000/6000/2500:びいかめのブロマガ - ブロマガ
  • 進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!

    はじめに 最近超人気の漫画として私のTwitter TLを賑わす作品、その名も「進撃の巨人」。 これだけ人気なんだからきっと面白いに違いないのですが、 なんか絵が怖そうだし、人がバンバン死んでてグロいっぽいという噂を聞くので、 なんとか漫画を読まずに、それでいて進撃の巨人のキャラについては知りたい、 そう願う潜在的進撃の巨人ファンも全国に70万人くらいいらっしゃると思います。 そこで、データから進撃の巨人にどんなキャラが登場するか推測してみましょう。 扱うデータとして、pixivのタグ情報を利用します。 商品レビューコメントなどとは違い、ファンの創作活動がダイレクトに反映されるサービスなので、 そこに付与されるタグ情報は、ファンの熱(過ぎる)いメッセージが込められているに違いありません。 今回、以下のような縛りを入れています。 1.勿論原作は見ない 2.pixivのタグ情報は参照するけど、

    進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!
  • Think Stats 第2版

    「プログラミングのスキルを統計の理解に役立てよう」というコンセプトで人気を博した第1版に大幅な加筆を行い、全面的に書き換えた改訂版です。数学的な観点から語られることが多い統計について、計算処理の観点から説明。実際にPythonのコードを示し、実データを分析しながら統計の基礎を解説しています。実際に手を動かしながら統計が学べる、という第1版の長所はそのままに、Anaconda、pandas、IPython Notebookといったツールやライブラリを使った統計手法を示すほか、仮説検定、回帰、時系列分析、生存分析などについて新たな章を追加し内容を充実させました。例題、演習問題をGitHubに掲載。プログラマのための統計入門の決定版です。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月で

    Think Stats 第2版
  • ニコニコ動画(Re:仮)

    ニコニコ動画(Re:仮)
  • 電子教科書

    電子教科書 (PDF形式) ネットで多少評価いただいた「基礎からの数学」や「基礎からの統計学」は、さらに学んでいくことにつながる教科書です。 基礎からの数学は、将来の読書の中でちょっとした数学的な記述にも耐えられるようにする教科書です。 基礎からの統計学は、Excel をベースにした統計の教科書で、ある程度理論にも触れています。 これに対して、ほんとに易しい遠隔授業用の教科書も作りました。 これは、C.Analysis を使った授業に完全に準拠したテキストです。 そのため、テキストの中に C.Analysis の Youtube 動画もリンクされています。 基礎数学A/Bは、数学アレルギーを少し取り除いて、数値を使った分析に臨む準備の授業です。 統計/統計分析は、卒業論文で統計学を使うことを想定して行われる授業です。(一番役に立ちます) 経営科学/意思決定論は、合理的に判断するとはどういう

  • 日本声優統計学会

    声優統計学会は声優,声,アニメ作品,ラジオ,アニメソング,アニメイベント,アニメスタッフ,及び声優ファンにまつわる諸現象に対して数理統計的・機械学習的アプローチを用いて分析する集団です. 日声優統計学会は正式な学会ではなく,同人活動を行うサークルです. 独自に構築した音素バランス文,及びそれらをプロの女性声優 3 名が 3 パターンで読み上げた音声です. (2020.11.01) あなたがライセンスがある程度自由な音素バランス文やその読み上げ音声を必要としている場合,声優統計コーパスではなく, JVS コーパスの利用を検討してください.より詳しい説明はこちらの文章をお読みください. 更新履歴 詳細な変更履歴はこちら (ChangeLog.md) をご確認ください. 2021年02月28日 : つくよみちゃんコーパスへのリンクを追加. 2020年11月01日 : JVS corpus

  • 統計的機械学習入門 | 中川研究室

    教科書は東京大学 工学教程 情報工学の「機械学習」です。現在は試作版を使っていますが、来年度までには市販版を刊行する予定です。 導入pdf 情報の変換過程のモデル化 ベイズ統計と例題(機械翻訳など) 教師あり学習と教師なし学習 識別モデルと生成モデル 最尤推定、MAP推定 データの性質と表現 Bayes推論pdf Bayesによる確率分布推定の考え方 多項分布、ディリクレ分布 事前分布としてのディリクレ分布の意味 1次元正規分布と事後分布 多次元正規分布 条件付き正規分布 指数型分布族 自然共役事前分布の最尤推定 線形回帰および識別pdf 線形回帰のモデル 正則化項の導入 L2正則化 L1正則化 正則化項のBayes的解釈 線形識別 2乗誤差最小化の線形識別の問題点 生成モデルを利用した識別 学習データと予測性能pdf 過学習 損失関数と Bias,Variance, Noise K-Ne

  • ベイズ推定の概要 超入門

    自殺の時空間疫学 http://ikiru.ncnp.go.jp/ikiru-hp/genjo/toukei/index.html 少研究数のメタ分析 Noma, H. Statist. Med. 2011, 30 3304–3312 K=10以下での信頼区間を向上させる Topics はじめに 推測統計の基 最尤推定とベイズ推定 MCMCによるベイズ推定

    ベイズ推定の概要 超入門
  • カップルが一緒にお風呂に入る割合をベイズ推定してみた

    質的変数(順序尺度)に有用なポリコリック相関係数を紹介しています。 また、ポリコリック相関係数を使った因子分析の方法も説明しています。

    カップルが一緒にお風呂に入る割合をベイズ推定してみた
    ING40
    ING40 2015/03/03
  • 1