タグ

統計に関するyunottinoatamaのブックマーク (13)

  • 厚生労働省のコンドームの統計資料にミスがあるかも - 人生万事こじらせるべからず

    勤労統計に誤りがあったが、元の資料が廃棄されてしまっている……というニュースを見てショックを受けました。 「もしかしてコンドームの出荷量の元資料も残ってないのか!?!?」 ライフワークとしてコンドームの出荷量について調べていたところ、15年ほど前までのデータについては他の誰かが作ってくれたグラフが残っていたのですが、最新のものについてはグラフが見つからなかったのです。 そこで、厚生労働省が発表している薬事工業生産動態統計調査から、コンドームの出荷量をひっぱって自力でグラフを作ることにしました。 www.mhlw.go.jp そしたらですね、一か月だけ外れ値を見つけてしまいました。 2009年12月だけコンドームの出荷量が普通の月の20倍になっている様子をご覧ください。 毎月、コンドームは2000〜3000万個の出荷量なのですが、2009年12月においては4億6000万個出荷していることにな

    厚生労働省のコンドームの統計資料にミスがあるかも - 人生万事こじらせるべからず
  • プロ声優を起用した音声合成用データ、無償公開 研究用途に期待

    声優やアニメを研究するサークルの日声優統計学会は6月26日、プロの声優を起用した音声データとテキストを含むデータベース「声優統計コーパス」をWebサイト上で公開した。音声合成ソフトの作成や言語研究などに使われるデータで、研究目的に限り無償で利用できるという。 公開したのは、プロの女性声優がさまざまな音の要素を含む文章(音素バランス文)を「通常」「喜び」「怒り」の感情別に読み上げたwavファイル。「また東寺のように五大明王と呼ばれる主要な明王の中央に配されることも多い」「カーミラ星と呼ばれている惑星から宇宙船に乗って地球に侵入した宇宙人」──などの文を読み上げている。 参加した声優は土谷麻貴さん(「喰霊-零-」「アルカナハート」など)、上村彩子さん(「エルドライブ」「惡の華」など)、藤東知夏さん(「けいおん!」「グッド・ドクター~禁断のカルテ~」など)。長さは計2時間、総ファイルサイズは7

    プロ声優を起用した音声合成用データ、無償公開 研究用途に期待
  • エラーページ - ヤフー株式会社

    指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

    エラーページ - ヤフー株式会社
  • Levenberg-Marquardtアルゴリズムで非線形回帰分析 - でたぁっ 感動と失敗の備忘録

    Rでminpack.lmパッケージのnls.lm関数を使うとLevenberg-Marquardt法で非線形回帰分析を行うことができる。言いかたはマルカート法、マーカート法?、フランスの方のようなのでマーカール法とも言われているようだ。私はマルカートで覚えていた。Levenberg-Marquardt法は非線形最小二乗問題を解く手法として広く使われている。最急降下法・ニュートン法を組み合わせた方法で現在の解が正解から遠い場合は遅いが収束することが保証されている最急降下法と同じように動作し、正解から近い場合はニュートン法を実行するとのこと。 非線形回帰を行うことになった背景 最近ECサイトの分析を行うことが多く、よく言われているベキ乗則を随所に見かける。データ例 > head(d) X Y 1 2 9794688 2 3 5973376 3 9 2946944 4 10 2649600 5

    Levenberg-Marquardtアルゴリズムで非線形回帰分析 - でたぁっ 感動と失敗の備忘録
  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

  • グラフの作り方講座(東京は暑くなっているのか問題を例に)

    気象庁から1950年以降の夏の(平均)気温データを取ってきてプロットしてみると 平均気温をセ氏0℃~40℃のスケールでグラフにしてみると、確かに年ごとの変動以上のものは見えないような気もします 斑賢二(HAN-NEKO,Kenji) 💜💙💛🟠🌈🎌🇷🇺🇺🇦 @Tvvitter_com 「ほんの30年前はクーラーもないのにみんな普通に生活していた、30度を超える火は珍しく猛暑日という言葉もなかった、近年暑くなった」 という話を小耳にはさんだので、気象庁から1950年以降の夏の気温データをとってきてプロットしてみた pic.twitter.com/x6rx7cbNAt

    グラフの作り方講座(東京は暑くなっているのか問題を例に)
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

  • 若者の○○離れ 傾向と対策 - 最終防衛ライン3

    若者の○○離れの4つの傾向 「若者の○○離れ」と言われて久しいですが、その多くは 『若者の○○離れ』という「天狗の仕業」*1 で、分析にすらなっていないものばかりです。 碌でもない「若者の○○離れ」の傾向と対策は以下の4つに分類できます。 1. 過去と比較しない 2. 若者の人口減少を考慮しない 3. 他の年齢層の減少を無視する 4. 印象で語る それぞれについて、具体例を示しながら説明していきます。 4つの傾向と対策を述べたら、若者の○○離れがいつ頃から使われるようになったのかを分析します。 1. 過去と比較しない 若年層の比率や絶対数が他の年齢層と比較して少なかったので「若者の○○離れ」と結論づける場合。 30代以上もかつては20代だったのだから、20代での割合が低いのは若者が離れたからだ、という考察は正しいでしょうか。調査した内容が年齢上昇に伴い増える項目の可能性があるため、過去と比

    若者の○○離れ 傾向と対策 - 最終防衛ライン3
  • 『ダメな統計学』冊子PDFの公開|Colorless Green Ideas

    『ダメな統計学』表紙 現在の科学研究において統計が誤用されていることが非常に多く、そのために科学研究の信頼性が揺らいでいることを記した『ダメな統計学』の冊子PDFを公開する。これは、アレックス・ラインハート氏が書いたStatistics Done Wrongの全訳である。理解を深めるために、訳注を比較的豊富に加えた。 2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』の冊子PDFに比べると、大幅に加筆されている。ページ数で言うと2倍以上になっている。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 『ダメな統計学

    『ダメな統計学』冊子PDFの公開|Colorless Green Ideas
  • 統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas

    統計についてほとんど何も知らない人が読むべきとしては『マンガでわかる統計学』が一番のおすすめである。 『マンガでわかる統計学』 「統計って、今まで全然勉強したことはないけれども、将来必要になるかもしれないから、勉強してみようかな」とか、「統計を勉強してみたいとは思ってるんだけど、何から始めれば良いか見当がつかないんだよね」と思っている人は少なくないと思う。こうした人、すなわち統計学についてほとんど何も知らない人は何を使って勉強し始めれば良いのだろうか。 こうした初心者は、まず入門として『マンガでわかる統計学』というを読むのが良いと私は考えている。このは、統計に関する知識がほとんどない人にとって、わかりやすく、そして取り組みやすいだ。 高橋信. (2004). 『マンガでわかる統計学』 東京:オーム社. この『マンガでわかる統計学』というは、統計について特に何も知らない女子高生のル

    統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas
  • 社会人のためのデータサイエンス入門/総務省統計局データサイエンス・オンライン講座

    統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標分布 ・信頼区間 データの見方と 適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公的統計とは ・公的データの入手

    社会人のためのデータサイエンス入門/総務省統計局データサイエンス・オンライン講座
  • 企業における統計学入門

    経済学部1年生対象の統計学の講義で用いた資料です。統計学を学び始めた学生さんに、企業で統計学を用いるとはどういうことかを紹介し、就活や仕事でも役立つと言うことを説明しました。 学生さんの統計学を学ぶモチベーションを高められたら幸いです。Read less

    企業における統計学入門
  • 面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!

    転職して丁度2年がたちました。 現在はWebベンチャーで統計屋しています。大変楽しい毎日です。 なぜ楽しいかというと勿論リスプを書いているからというのも大きなる理由の一つです*1。 このエントリでは何が楽しいのか近況交えてつらつらまとまりなく書いてます。 あと現職の解決しがたい不満についても書いています。 糞長くなってしまったので要約すると 「今糞面白いけど超えられない壁あるので誰か助けて」 です。 現職面白い理由5個。 1.データが面白い*2 私は経済学科・数理統計の研究室出身で、応用先としてコミュニケーション活性化を目的とした 行動経済学やテキストマイニングをやっていました。 そういう背景があるため、学生時代いつか壮大な社会実験をやりたいと思ってたけど、 それには大変なお金がかかったり大がかりなシステムを構築しないといけなかったりで断念した。 ですが今はSNSやソーシャルゲームや広告の

    面白いデータは転がりまくってるけど転がってるままなので誰か助けてくれろ - あんちべ!
  • 1