[B! Python][statistics] clavierのブックマーク

clavier id:clavier

Pythonとstatisticsに関するclavierのブックマーク (10)

因果推論100本ノック(1)因果効果とランダム割付
はじめに因果推論100本ノック（自作）1本目~10本目の問題とPythonのサンプルコードです．問題の不備や内容の誤り等ありましたら，ご指摘いただけますと幸いです．設定アナリストの分析レポートが営業の受注件数にどれくらい貢献しているかを分析するケースを考えます．今回は，下記フォルダの「causal_knock1.csv」ファイルのデータを利用します．データのカラムの概要は下記の通りです．変数名データの概要備考
clavier 2023/07/23
python

統計

analytics

statistics

あとで読む

education
リンク
Python pandas データのイテレーションと関数適用、pipe - StatsFragments
pandas ではデータを列や表形式のデータ構造として扱うが、これらのデータから順番に値を取得 (イテレーション) して何か操作をしたい / また何らかの関数を適用したい、ということがよくある。このエントリでは以下の 3 つについて整理したい。イテレーション関数適用 pipe (0.16.2 で追加) それぞれ、Series、DataFrame、GroupBy (DataFrame.groupbyしたデータ) で可能な操作が異なるため、順に記載する。まずは必要なパッケージを import する。 import numpy as np import pandas as pd イテレーション Series Series は以下 2つのイテレーション用メソッドを持つ。各メソッドの挙動は以下のようになる。 __iter__: Series の値 ( values ) のみをイテレーシ
clavier 2021/11/07
pandas

python

statistics

map

あとで読む

development
リンク
Python pandas データ選択処理をちょっと詳しく <前編> - StatsFragments
概要書いていて長くなったため、まず前編として pandas でデータを行 / 列から選択する方法を少し詳しく書く。特に、個人的にはけっこう重要だと思っている loc と iloc について日本語で整理したものがなさそうなので。サンプルデータの準備 import pandas as pd s = pd.Series([1, 2, 3], index = ['I1', 'I2', 'I3']) df = pd.DataFrame({'C1': [11, 21, 31], 'C2': [12, 22, 32], 'C3': [13, 23, 33]}, index = ['I1', 'I2', 'I3']) s # I1 1 # I2 2 # I3 3 # dtype: int64 df # C1 C2 C3 # I1 11 12 13 # I2 21 22 23 # I3 31 32
clavier 2021/11/07
python

pandas

statistics

development

data

programming

machinelearning
リンク
Catboostとは？XgboostやLightGBMとの違いとPythonでの使い方を見ていこうー！！｜スタビジ
当サイト【スタビジ】の本記事では、XgboostやLightGBMに代わる新たな勾配ブースティング手法「Catboost」について徹底的に解説していき最終的にPythonにてMnistの分類モデルを構築していきます。LightGBMやディープラーニングとの精度差はいかに！？こんにちは！消費財メーカーでデジタルマーケター・データサイエンティストをやっているウマたん(@statistics1012)です！ Xgboostに代わる手法としてLightGBMが登場し、さらにCatboostという手法が2017年に登場いたしました。これらは弱学習器である決定木を勾配ブースティングによりアンサンブル学習した非常に強力な機械学習手法群。計算負荷もそれほど重くなく非常に高い精度が期待できるため、Kaggleなどのデータ分析コンペや実務シーンなど様々な場面で頻繁に使用されているのです。
clavier 2021/11/06
kaggle

statistics

study

python

catboost

lightgbm

xgboost
リンク
数学、統計学を学ぶ上で必須となる「集合・数列」の6つの数学記号をPythonコードと図で理解する
数学、統計学を学ぶ上で必須となる「集合・数列」の6つの数学記号をPythonコードと図で理解する：「AI」エンジニアになるための「基礎数学」再入門（6）（1/2 ページ） AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回は数学、統計学を学ぶ上で必須となる「集合・数列」の数学記号についてPythonコードと図を交えて解説します。
clavier 2020/02/03
統計

math

statistics

python
リンク
「AI」エンジニアになるための「基礎数学」再入門 - ＠IT
AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す連載。今回は「回帰分析」には対数変換を用いるとよい理由について解説します。
clavier 2019/02/15
あとで読む

math

python

機械学習

statistics

*あとで
リンク
野球好きが統計学を覚える為の学習フローを作ってみました - Lean Baseball
こんにちは.野球(とグルメ)の人です.*1 ビックデータや統計学が相変わらずアツい話題になっている中,野球好きとデータ好きをうならせるこんな本が出版されました. [プロ野球でわかる! ]はじめての統計学作者: 株式会社DELTA,佐藤文彦,student,岡田友輔出版社/メーカー: 技術評論社発売日: 2017/03/14メディア: 単行本（ソフトカバー）この商品を含むブログを見るこの本,早速読ませてもらってとても良い！感銘を受けた！！という感じなのですが, そもそも世の中に野球統計学(セイバーメトリクス)の本が増えてきた (野球好きでも)初心者がいきなり読んだら辛い本もあるぞ！？？？「ワイも野球データを集めて分析したいンゴ」 …などなど,クエスチョンやテーマができたので, 今まで学んだ・実践した野球統計学の学び方・本・データを整理するのにいい機会だ！ …ということで, レベル別の本
clavier 2017/03/20
baseball

統計学

statistics

Python

あとで読む
リンク
python - 機械学習の「朱鷺の杜Wiki」
python一般† python.org：公式サイト Wiki Package Index iOS用Python環境 Computable Python for iOS Python Math PyPad Pythonista 英語資料 Python Course：Python のいろいろなトピックについての講義を集めたサイト Python Quick Reference @ Richard Gruet (旧版日本語訳) Google's Python Class OLamp.com -- Python Dev Center：O'Reillyのpython関連ニュース Python Miro Community：チュートリアル講演ビデオのポータル Wikipedia:Python_(programming_language) Python tools that everyone shou
clavier 2016/03/10
機械学習

python

library

machinelearning

まとめ

statistics
リンク
Python for Financeという本 - xiangze's sparse blog
ipython notebookを使って出版されたらしいPython for Financeという本を読みました。 numpy, scipy, pandas, PyMC3をはじめとしたPythonの数値計算、解析系のパッケージを使った金融工学の計算事例と自作ライブラリについての紹介になっています。 Python for Finance: Analyze Big Financial Data 作者: Yves Hilpisch出版社/メーカー: Oreilly & Associates Inc発売日: 2014/12/27メディア: ペーパーバックこの商品を含むブログを見るhttp://shop.oreilly.com/product/0636920032441.do https://books.google.co.jp/books?id=7tzSBQAAQBAJ&printsec=fron
clavier 2015/02/22
development

Python

finance

statistics

library
リンク
ログを分析するには？ XMLデータを分析するには？ pandasでデータを分析できる状態にする
ログを分析するには？ XMLデータを分析するには？ pandasでデータを分析できる状態にする：IT エンジニアのためのデータサイエンティスト養成講座（4）（1/3 ページ）データと情報は似て非なるもの。意味のある情報を取り出すために、データを「使える」状態にするには意外と地道な手続きが必要です。手短に実行するために必要なスキルを紹介していきます。連載バックナンバーはじめに前回はデータを取り込んだり書き出したりする方法を紹介しましたが、実際の分析対象となるデータのほとんどは、そのまま分析できる状態にはありません。Webログなどはカンマ区切り形式ではなくスペースやカッコで区切られていますので、データを分割する必要があります。また、時系列に関する項目もフォーマットがまちまちなので統一する必要がありますので時系列データのクレンジングについても解説します。では早速具体的な例を使って説明してい
clavier 2013/07/22
statistics

python

xml
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx