タグ

ブックマーク / qiita.com/ynakayama (5)

  • ウェブアプリケーションフレームワーク Flask を使ってみる - Qiita

    Ruby は柔軟なプログラミング言語であり Sinatra のような手軽で軽量なウェブアプリケーションフレームワークがあります。いままで分析用の言語として主に Python で統計やデータの可視化をおこなってきましたが、もちろん Python にも多種多様なウェブアプリケーションフレームワークがあります。 数値計算などを Python でおこなう仕組みをウェブシステムとして提供したい場合、わざわざ別の言語を利用するよりウェブの部分も同じ言語で作ってしまったほうが一貫性があります。 そこで今回は Flask という Python の小規模なフレームワークを利用し、ごく簡単なウェブアプリケーションを作ってみます。 Flask には日語訳された親切なユーザーガイドがあります。 https://a2c.bitbucket.io/flask/ とても丁寧に書かれているので、基的にはこのドキュメン

    ウェブアプリケーションフレームワーク Flask を使ってみる - Qiita
  • 統計学の代表的な手法を実践する (3) 〜 続・ロジスティック回帰 - Qiita

    前回はロジスティック回帰について、概要について参考文献を紹介、使いどころと使用例を説明しました。 前回も述べた通り、ロジスティック回帰とは二値論理と言われる true か false かという論理に関するアウトカムを分析するための方法です。 今日は実際にオリジナルのデータを使ってロジスティック回帰分析をし、その結果について考察してみたいと思います。 想定するシナリオ 今回は話をわかりやすくするためにオンラインゲームを想定します。 あるオンラインゲームでは毎月イベントがあります。このイベントではフレンド同士で協力して戦ってスコアを稼ぎます。そして、スコアが高い上位ランキング 1,000 位以内に入ると特別な報酬が貰えます。 前回の実績となる数名のユーザーのデータを集めたので、ここからランキング上位に入賞するための成功要因を分析したいと思います。 いかがでしょうか。わかりやすくするためにゲーム

    統計学の代表的な手法を実践する (3) 〜 続・ロジスティック回帰 - Qiita
  • 統計学の代表的な手法を実践する (1) - Qiita

    西内啓氏著書の「統計学が最強の学問である」と「統計学が最強の学問である実践編」はシリーズ累計 37 万部を突破する異例のベストセラーとなりました。読まれた方も多いのではないでしょうか。 この前後 2 冊では、統計学の教科書に登場する様々な手法を「一般化線形モデル」という考え方に基づき一枚の表にまとめています。 ここではその表を引用致します。 統計学が最強の学問である p170 一般化線形モデルをまとめた一枚の表 統計学が最強の学問である実践編 p344 統計学の理解が劇的に進む 1 枚の表増補版 これらの 2 冊は、ビジネスでよく使う統計手法について、一通りそれらがどういう意味を成しているか、どのようなアイデアから生まれてどう使えばいいかといったことが解説されています。 また上著実践編 p357 では書では得られない 3 つの知識として 1. ツールと実データを使った実践 2. 数理面で

    統計学の代表的な手法を実践する (1) - Qiita
    razokulover
    razokulover 2016/01/11
    最後のカイ二乗検定、有意水準5%だと喫煙の有無が肺がんの症例に影響ありなんじゃないの
  • scikit-learn から学ぶ機械学習の手法の概要 - Qiita

    前回、株式の時系列データを分析する話で、後半にちょっとだけ機械学習の話をしました。今日は機械学習ライブラリ scikit-learn に触れます。 scikit-learn といえば以前にも簡単なクラスタリングの例をあげたり、サポートベクトルマシンやクラスタリングで問題を解く、 TF-IDF を計算する、回帰モデルの可視化、 DBSCAN によるクラスタリングといったことをしてきましたが、あらためてライブラリの機能を整理します。 機械学習と言うと難しい数学を駆使するイメージがつきまといますが、完成度の高いライブラリを使えば利用者が機械学習の手法そのものを実装しなくても利用することはできます。もちろん手法の内容に対する理解は必要ですが、せっかく scikit-learn という事実上デファクトとも言えるライブラリが存在するのですから、これを使うところから入門していくのが良いかと思います。 以

    scikit-learn から学ぶ機械学習の手法の概要 - Qiita
  • 線形回帰と相関係数、そして東京の平均気温を実際に分析してみる - Qiita

    線形回帰における仮定 前々回、前回 と線形回帰について説明してきました。 線形回帰における最小二乗法では Y 軸の点と点の全体的な長さの差異 (= これを、それぞれの差の二乗を取ってから加算するので二乗誤差といいます) が最小になるように、まっすぐな線 (= 1 次式の直線となる関数) を求めました。すなわち、データの集合から直線に回帰する推定をおこなったわけです。 相関係数を求める どんな 2 次元データでも線形回帰で関数を導くことはできますが、それが妥当かどうか気になります。そこで両者の相関係数を求めます。相関係数はベクトル v1, v2 からそれぞれの要素 x, y の平均を求め、次に v1, v2 の分散と共分散を求めます。コードで表現してみましょう。 def correlation(data): n = len(data) # 二次元データの長さを n に求める xm = 0.0

    線形回帰と相関係数、そして東京の平均気温を実際に分析してみる - Qiita
  • 1