タグ

統計に関するhpptmsのブックマーク (3)

  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

    追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

    データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
  • プリキュアは10年間、何を唄ってきたのか。-テキストマイニングより- - プリキュアの数字ブログ

    (追記) 作詞者である只野菜摘先生からツイッターでコメントいただきました。 あと、イェイの回数について、コメントしました。 只野菜摘先生からコメント頂いちゃいました。 (文) プリキュアは10年間の年月をかけて、何を唄ってきたのでしょうか。 調べました。 久しぶりのテキストマイニングです。今回は、プリキュアの唄の歌詞です。 <条件> ・「うたまっぷ」に登録されているプリキュアソング281曲(2015年8月15日現在)からTVサイズなど重複分などを除いた全257曲 ・Lyrics Master2を使いテキスト化のち、解析ソフト「KHCoder」にて分析 で、結果です。 プリキュアソング頻出150ワード まずは頻出150ワードです。 全257曲中における頻出語150です*1 こんな感じになりました。 トップ5はこれです。 1位:プリキュア 2位:Go 3位:みんな 4位:夢 5位:笑顔 最頻

    プリキュアは10年間、何を唄ってきたのか。-テキストマイニングより- - プリキュアの数字ブログ
  • 1