タグ

pythonと統計に関するatm_09_tdのブックマーク (13)

  • 統計の素人だけどPythonで機械学習モデルを実装したい、そんな人のための第一歩 - Qiita

    はじめに 『統計にそんなに詳しくないけど、機械学習とかのモデルを自分で実装してみたい!』 ってことよくありますよね? 『そんなこと全くないわー(#^ω^)』って思った人も素直になってください。 絶対に一度は思ったことがあるはずです。 とくにPythonでロジスティック回帰を実装したいと思ったことがある人は多いと思います。 多いはずです。 ここでは、統計の知識をヌルくと説明しつつPythonで実際に動くLogistic回帰モデルを実装します。 統計に詳しくない方でも無理なく出来るよう、統計の説明➔実装 を1ステップづつ進められるようにしました。 なんでかんで、統計モデルとか機械学習も自分で実装しながら覚えると効率がよかったりします。 この記事の対象読者 基的にはデータサイエンスに多少興味ある方向けです。 ロジスティック回帰って聞いたことあるけど、よくわからん 上司がロジスティック回帰でクラ

    統計の素人だけどPythonで機械学習モデルを実装したい、そんな人のための第一歩 - Qiita
  • pythonのstatisticsを使って数理統計入門 | DevelopersIO

    pythonでは標準ライブラリでstatistics - 数理統計関数が用意されています。 これを使えば、簡単に平均値、中央値、分散、標準偏差を求められます。 動作確認環境 $ python --version Python 3.8.5 平均値 算術平均 import statistics data = [13, 15, 25, 37, 40, 50, 57, 61, 90, 99] result = statistics.mean(data) print(result) >>> 48.7 1.30 ms 調和平均 import statistics data = [13, 15, 25, 37, 40, 50, 57, 61, 90, 99] result = statistics.harmonic_mean(data) print(result) >>> 32.178532252935

    pythonのstatisticsを使って数理統計入門 | DevelopersIO
  • Python: 中心化移動平均 (CMA: Centered Moving Average) について - CUBE SUGAR CONTAINER

    以前から移動平均 (MA: Moving Average) という手法自体は知っていたけど、中心化移動平均 (CMA: Centered Moving Average) というものがあることは知らなかった。 一般的な移動平均である後方移動平均は、データの対応関係が原系列に対して遅れてしまう。 そこで、中心化移動平均という手法を使うことで遅れをなくすらしい。 この手法は、たとえば次のような用途でひとつのやり方として使われているようだ。 不規則変動の除去 季節変動の除去 使った環境は次のとおり。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.14.6 BuildVersion: 18G3020 $ python -V Python 3.7.7 下準備 下準備として、必要なパッケージをインストールしておく。 $ pip install pa

    Python: 中心化移動平均 (CMA: Centered Moving Average) について - CUBE SUGAR CONTAINER
  • 【保存版・初心者向け】独学でAIエンジニアになりたい人向けのオススメの勉強方法 - Qiita

    追記 【2020年版・初心者向け】独学でAIエンジニアになりたい人向けのオススメの勉強方法 【保存版・初心者向け】独学でAIエンジニアになりたい人向けのオススメのAI勉強方法 また、Python機械学習がオンライン上で学べるAI Academyをnoteでも書きましたが、3/17日からほとんどのコンテンツを永続的に無料で利用できるよう致しましたので、是非使って頂けますと幸いです。 AI Academy Bootcamp 我々が提供している個人向けオンラインAIブートキャンプのご紹介です。 AI Academy Bootcamp AI Academy Bootcampは、「短期間でAI活用スキルを付けたい」と考えている方や、 「データサイエンティスト」や「機械学習エンジニア」として就業を目指している方向けの AI特化型オンラインブートキャンプです。 講義動画とオンラインマンツーマンの演習授

    【保存版・初心者向け】独学でAIエンジニアになりたい人向けのオススメの勉強方法 - Qiita
  • 統計: 偏相関係数で擬似(無)相関の有無を調べる - CUBE SUGAR CONTAINER

    以前、このブログでは共分散や相関係数について扱ったことがある。 共分散や相関係数というのは、二つの変数間に線形な関係があるかを調べる方法だった。 blog.amedama.jp しかし、実はただの相関係数では「第三の変数」からの影響を受けてしまう場合がある。 それというのは、第三の変数の存在によって、あたかも相関しているように見える (疑似相関) あるいは相関していないように見える (疑似無相関) というもの。 これは実際の例がないと、なかなか分かりづらいものだと思うんだけど良い例があったので紹介してみる。 今回はプロ野球の打撃成績に潜む疑似無相関を偏相関係数であぶり出してみることにする。 データをスクレイピングする ひとまずデータがないと話にならないので、まずはスクレイピングしてくるところから始める。 使った環境は次の通り。 $ sw_vers ProductName: Mac OS X

  • 私たちはいかにして環状線で”悪さをする列車”を捕まえたか | プログラミング | POSTD

    文:Daniel Sim 分析:Lee Shangqian、Daniel Sim、Clarence Ng ここ数ヶ月、シンガポールのMRT環状線では列車が何度も止まるものの、その原因が分からないため、通勤客の大きな混乱や心配の種となっていました。 私も多くの同僚と同じように環状線を使ってワンノースのオフィスに通っています。そのため、11月5日に列車が止まる原因を調査する依頼がチームに来た時は、ためらうことなく業務に携わることを志願しました。 鉄道運営会社SMRTと陸上交通庁(LTA)による事前調査から、いくつかの電車の信号を消失させる信号の干渉があり、それがインシデントを引き起こすことが既に分かっていました。信号が消失すると列車の安全機能である緊急ブレーキが作動するため、不規則に電車が止まる原因となります。 しかし8月に初めて発生した今回のインシデントは、不規則に起こっているように見えるた

    私たちはいかにして環状線で”悪さをする列車”を捕まえたか | プログラミング | POSTD
  • 統計: 二つのグループの平均と分散を合成する - CUBE SUGAR CONTAINER

    例えば、あるグループ A と B が別々にテストを受けたとする。 それぞれのグループの人数と平均点、そして分散は分かっているとしよう。 このとき、グループ A と B を合わせた全体での平均や分散は計算することができるだろうか? 結論から言うと、これはできる。 今回は、その手順について書いてみることにする。 また、同時に Python を使ってサンプルデータを生成したり計算の裏付けをしてみよう。 使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.11.6 BuildVersion: 15G1212 $ python --version Python 3.5.2 題材とするデータを生成する 平均や分散の計算を楽にするために、まずは NumPy をインストールしておこう。 $ pip install numpy そして

    統計: 二つのグループの平均と分散を合成する - CUBE SUGAR CONTAINER
  • 統計: ポアソン分布を使って今後の大地震が起こる確率を求めてみる - CUBE SUGAR CONTAINER

    ポアソン分布というのは、ごくまれに起こるような事象の確率分布をいう。 この説明を聞いても何のこっちゃという感じだけど、これを使うと滅多に起こらないようなことがある時間内にどれくらい起こりそうなのかが分かる。 もちろん、別に未来を予知しているわけではなく、あくまで過去の生起確率からはそのように求まるというのに過ぎない。 定義 ポアソン分布は次の数式で求められる。 まず が、その滅多に起こらないような事象の単位時間あたりの生起確率になっている。 そして が単位時間あたりにその事象が何回起こるかを表す変数になっている。 日で今後一年間に震度 7 の地震が起こる確率を求めてみよう それでは、手始めにポアソン分布を使って今後一年間に震度 7 の地震が日の何処かで起こる確率を求めてみよう。 ちなみに、実際に政府が今後 X 年間にとある地域でマグニチュード Y 以上の地震が起こる確率を計算するときは

  • 情報処理学会学会誌の巻頭コラム。漫画家すがやみつるさん。バリバリのPython使いで統計やりまくってるんだ。\(^O^)/: ホットコーナー

    ブログ(iiyu.asablo.jpの検索) ホットコーナー内の検索 でもASAHIネット(asahi-net.or.jp)全体の検索です。 検索したい言葉のあとに、空白で区切ってki4s-nkmrを入れるといいかも。 例 中村(show) ki4s-nkmr ウェブ全体の検索 ASAHIネット(http://asahi-net.jp )のjouwa/salonからホットコーナー(http://www.asahi-net.or.jp/~ki4s-nkmr/ )に転載したものから。 --- 情報処理学会のツイート。 https://twitter.com/IPSJcom/status/535583120200695810 --- ここから --- #IPSJ 情報処理学会 学会誌「情報処理」12月号を発行いたしました。特集 のテーマは「パーソナルデータの利活用における技術および各国法制度の動

  • Pythonで一般化線形モデル - old school magic

    概要 統計の勉強の一環で、最近はこのを読んでます。かなり分かりやすいです。 データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学) 作者: 久保拓弥出版社/メーカー: 岩波書店発売日: 2012/05/19メディア: 単行購入: 16人 クリック: 163回この商品を含むブログ (19件) を見る統計モデリングに関するです。一般化線形モデルを中心に話が進んでいきます。 このはRを中心に話が進んでいきますが、せっかくなのでPythonで一般化線形モデルを試してみようと思います。 Pythonの統計ライブラリ 一般化線形モデルとは、線形回帰を(正規分布以外でも使えるように)拡張した統計モデルです。 詳しい説明は教科書に譲るとして、Pythonでのライブラリについてお話します。 Pythonで一般化線形モデル、というか統計全般のライブラ

    Pythonで一般化線形モデル - old school magic
  • はてなブックマーク記事のレコメンドシステムを作成 PythonによるはてなAPIの活用とRによるモデルベースレコメンド - データ分析がしたい

    私は情報収集にはてなブックマークを多用しており、暇な時は結構な割合ではてなブックマークで記事を探してます。しかし、はてなブックマークは最新の記事を探すのは便利ですが、過去の記事を探すにはいまいち使えません。個人的には多少過去の記事でも自分が興味を持っている分野に関しては、レコメンドして欲しいと感じてます。 ありがたいことにはてなAPIを公開しており、はてなブックマークの情報を比較的簡単に取得できます。そこでこのAPIを利用して自分に合った記事を見つけるようなレコメンド機能をRとPythonで作成してみたいと思います。 利用するデータは、はてなAPIを使って収集します。具体的には、はてなブックマークフィードを利用して自分のブックマークしているURLを取得し、そのURLをブックマークしているユーザをエントリー情報取得APIを用いて抽出し、そのユーザのブックマークしているURLを収集します。こ

    はてなブックマーク記事のレコメンドシステムを作成 PythonによるはてなAPIの活用とRによるモデルベースレコメンド - データ分析がしたい
  • こんにちは統計学:Pythonによるχ2乗検定・t検定・U検定・分散分析・多重比較・相関係数の計算 - すがやみつる

    マンガを描くとき、シナリオを先に書く人もいるかと思います(私は、そうしています)。 また、原作付きマンガを描いている人で、シナリオをテキストファイルやワープロソフトのファイルで受け取る人もいるでしょう。 いまマンガを描く人は、ほとんどがClipStudioを使っているはずです。そのようなマンガ家なら、シナリオからネーム部分(セリフとナレーション)だけ抜き出せたら便利だと思いませんか? そこで自作シナリオのネーム部分だけを抜き出し、句読点や「!・!!・?・!?・空白」が来ると、そこで改行するプログラムを作ってみました。 元のシナリオを「input.txt」という名前で保存し、同じフォルダにこのプログラムを置いてください。Pythonのインストールがすんでいれば、あとはこのプログラムのアイコンをダブルクリックするだけで、改行されたネームだけになったファイルが「output.txt」という名前で

  • こんにちは統計学:Pythonによるχ2乗検定・t検定・U検定・分散分析・多重比較・相関係数の計算

    プログラミング言語PythonCGIに使った統計計算プログラムです。 とくに難しい設定は必要なく、ただデータを貼り付けるだけです。 心理検定などで統計計算が必要な方は、お試しになってみてください。 どんなときに、どんな統計分析を使うのか?

    atm_09_td
    atm_09_td 2011/06/07
    懐かしい。「こんにちはマイコン」を思い出す。
  • 1