タグ

ブックマーク / shinyorke.hatenablog.com (7)

  • うわっ…私のpandas、遅すぎ…?って時にやるべきこと(先人の知恵より) - Lean Baseball

    ※あくまでもイメージです(適当) 仕事じゃなくて、趣味の方の野球統計モデルで詰まった時にやったメモ的なやつです.*1 一言で言うと、 約19万レコード(110MBちょい)のCSVの統計処理を70秒から4秒に縮めました. # 最初のコード $ time python run_expectancy.py events-2018.csv RUNS_ROI outs 0 1 2 runner 0_000 0.49 0.26 0.10 1_001 1.43 1.00 0.35 2_010 1.13 0.68 0.32 3_011 1.94 1.36 0.57 4_100 0.87 0.53 0.22 5_101 1.79 1.21 0.50 6_110 1.42 0.93 0.44 7_111 2.35 1.47 0.77 python run_expectancy.py events-2018.c

    うわっ…私のpandas、遅すぎ…?って時にやるべきこと(先人の知恵より) - Lean Baseball
    khtno73
    khtno73 2020/06/05
    ありがたやありがたや
  • 退屈なことはPythonにやらせる...前に考えるべきこと - Lean Baseball

    機械学習, データサイエンスを志向してPythonを勉強したり,この辺のエントリーでを読み漁ったりすると*1, もしかして, 私の仕事ってプログラミングで楽になるのでは!? と気がつく(もしくはそういう記事・を読んで触発される)瞬間があるかと思います, このとかあのとか. このエントリーではそんな素晴らしい学び*2に対して,一つの回答を示してみたいと思います. TL;DR(ここは読んでほしい) プログラミングで解決できる「退屈なこと」とは「回数が多く, 属人性が少ない」作業のことである. 属人性がある仕事はプログラミングをする前に因数分解しよう or 「仕事ごっこ」だったらやめる努力をしよう. Pythonで「退屈なこと」をやるなら,「退屈なことはPythonにやらせよう」もいいですが,「できる仕事がはかどるPython自動処理 全部入り。」が個人的にはおすすめです. 言いたいこと

    退屈なことはPythonにやらせる...前に考えるべきこと - Lean Baseball
    khtno73
    khtno73 2019/07/16
    「仕事ごっこ」の沢渡あまねさんは、職場の改善地図とかITIL本とかも読みやすい。プラクティカルな業務改善のヒント出し上手いんだよな。現実で上を説得できるかはまた別の話なので余計ストレス貯まることもあるが。
  • ホームランのひみつ(MLB編)〜バレルゾーンをPythonとBigQueryで可視化してみた - Lean Baseball

    このグラフは2017年MLB(メジャーリーグベースボール)の打球データ約11万レコード(球)を打球速度×打球角度で可視化したものです. ちょっとした傾向が見えますね,,,それを解説するのがこのエントリーのゴールです. こんにちは,野球エンジニアです. TL;DR 「ホームランになりやすい打球速度と打球角度」の組み合わせを「Barrel Zone(バレル・ゾーン)」と呼ぶ 長打を飛ばす上で,打球速度と打球角度を意識して飛ばすが重要!というのが今のトレンド 打球を転がす(抜ける)ような当たりを目指すのはもう昔のお話(ただし否定はしない) この手のデータの楽しみを知ってほしい!!!...のでみんなBaseball Geeksを読んでね!(宣伝) なお,弊社「ネクストベース」が運営しているメディア「Baseball Geeks」の応援コンテンツであり, 先日(3/10)に開催しました「Python

    ホームランのひみつ(MLB編)〜バレルゾーンをPythonとBigQueryで可視化してみた - Lean Baseball
    khtno73
    khtno73 2018/03/13
  • ダルビッシュ有さんが2017年に投げた投球データをPythonとBigQueryで軽く調べてみた - Lean Baseball

    今日で週休七日生活が終わる野球エンジニアこと@shinyorkeです. 昨年末に,BigQueryに突っ込んだ野球データでダルビッシュ有さん(@faridyu)の投球データについてかる~く調べてみました. 「今年こそPythonデータ分析するぞ!」 「BigQueryをPythonから使いたいぞ!」 っていう野球好きの方の参考になれば幸いです. なお今回はホントにデータを覗き見した程度の軽いネタです. TL;DR 投球コースを散布図で可視化するといい感じになる 球種と結果をSankey Diagramにするのも面白い BigQueryとJupyter,pandasの組み合わせすっごい楽 次回はPySparkあたりで学習とかさせたい 多分おそらく@faridyuさんはここに書いた分析と傾向の斜め上をいくと思ういや行って欲しい(ファンとして) Starting Member TL;DR St

    ダルビッシュ有さんが2017年に投げた投球データをPythonとBigQueryで軽く調べてみた - Lean Baseball
    khtno73
    khtno73 2018/02/01
  • 夢は正夢〜「野球エンジニア」としてのキャリアのはじまり - Lean Baseball

    写真は野球好きの同志(同僚)から餞別&メッセージとして頂いた「栗山魂」です.*1 なお,サインは栗山英樹(北海道ハムファイターズ監督)さん直筆とのこと. TL;DR 野球エンジニアになります,2月から. 「夢は正夢」〜「なるんだ!」という強い気持ちであくせく頑張ることは当に大切 次はNPBなりMLBの中でエンジニアになるんだ! Starting Member TL;DR Starting Member 当に「野球エンジニア」になります 夢は正夢〜「なるんだ!」という強い気持ちと頑張りは大切(プラス,応援ありがとうございます!) 今後のキャリアについて Rettyでの一年間と感謝 今後の活動について(例えばもくもく会とか) Pythonもくもく自習室@Rettyオフィスは継続します! 今年の登壇予定(Baseball Play Study, PyCon JP 2018) 当に「野球

    夢は正夢〜「野球エンジニア」としてのキャリアのはじまり - Lean Baseball
    khtno73
    khtno73 2018/01/15
    『334分考えてみましたが』なんでや!阪ry
  • プロ野球全球団の得点源な選手(または足を引っ張ってる選手)を野球統計学とPythonで出してみた - Lean Baseball

    ※2017/5/9 リンク切れを修正 ビール🍻とハンバーガー🍔をたしなみながらブログ書いてました.*1 野球,楽しんでいますかー!? アスレチックスが「定位置」に下がる中,日ハムが調子戻してきてようやっと野球を見る気になった私ですこんばんは.*2 今年度初の野球ネタです. PyCon mini Kumamoto 2017のエントリーで紹介させてもらった野球ネタの応用として, 2017年プロ野球,全球団の得点源と足を引っ張ってる選手を可視化 できる何かを作ったので,私の考察とともにお見せしたいと思います. 贔屓チームが強い(弱い)のはなぜ!? 野球統計学なにそれ美味しいの? Pythonでデータをいじりたいのだが! を直感的に知りたい方はぜひ最後までお付き合いくださいませ. なお,指標値は私(shinyorke)独自算出のモノであり,他のコピーではないです&他のシンクタンクやMediaで

    プロ野球全球団の得点源な選手(または足を引っ張ってる選手)を野球統計学とPythonで出してみた - Lean Baseball
    khtno73
    khtno73 2017/05/08
  • 野球好きが統計学を覚える為の学習フローを作ってみました - Lean Baseball

    こんにちは.野球(とグルメ)の人です.*1 ビックデータや統計学が相変わらずアツい話題になっている中,野球好きとデータ好きをうならせるこんなが出版されました. [プロ野球でわかる! ]はじめての統計学 作者: 株式会社DELTA,佐藤文彦,student,岡田友輔出版社/メーカー: 技術評論社発売日: 2017/03/14メディア: 単行(ソフトカバー)この商品を含むブログを見る この,早速読ませてもらってとても良い!感銘を受けた!!という感じなのですが, そもそも世の中に野球統計学(セイバーメトリクス)のが増えてきた (野球好きでも)初心者がいきなり読んだら辛いもあるぞ! ???「ワイも野球データを集めて分析したいンゴ」 …などなど,クエスチョンやテーマができたので, 今まで学んだ・実践した野球統計学の学び方・・データを整理するのにいい機会だ! …ということで, レベル別の

    野球好きが統計学を覚える為の学習フローを作ってみました - Lean Baseball
    khtno73
    khtno73 2017/03/21
  • 1