2018年3月18日のブックマーク (3件)

  • KaggleのCTR予測コンペで上位10%に入るまでの試行錯誤 - yasuhisa's blog

    週末KagglerとしてavazuのCTR予測コンペに参加しました。Kaggleは機械学習版のISUCONだと思ってもらえばよいです。コンペ自体は終わっているので、late submiteであまり意味はないかもしれません、練習です。leaderboard上で上位10%以内に行けたので、そこまでの試行錯誤をメモしておきます。謎ノウハウ(?)を持っているガチ勢じゃないと上位に行けないものかと思っていましたが、基に忠実にやればこれくらいの順位(上位7.6%)に行けましたし、他の人の工夫を垣間見えるという意味でも現場の機械学習やり始めたエンジニアにお薦めできそうでした。 参加の動機 目標感: 頑張りすぎずに上位10%以内に入る 試行錯誤 AthenaとRedashによる探索的データ解析 ベンチマークをまず超える 線形分類器でシンプルな特徴量 時系列要素を忘れていて過学習発生 特徴量エンジニアリン

    KaggleのCTR予測コンペで上位10%に入るまでの試行錯誤 - yasuhisa's blog
  • 論文作成・研究に役立つ 統計学を勉強しよう - はてなニュース

    数学や数式や難しい専門用語が出てくる統計学、「とっつきにくい」「数学はちょっと」と思う方も多いのではないでしょうか。しかし、卒業論文や修士論文を書こうとする人には、分野によっては統計学が必要になる場合が出てくることも。論文を進める合間に、統計学の学び方について説明している人気の記事に目を通しておくとよいかもしれません。 卒論修論のために、これから統計学を学ぶつもりの人に知って欲しい5箇条 - 女教師ブログ 統計処理ソフト R 入門 講習会資料 「女教師ブログ」では、「先輩から教えてもらわない」「(最低限の)数式の暗記・理解は、覚悟する」などの5項目を挙げ、それらについて学術論文を書く際に注意した方がいいポイントをまとめています。また、最後の項目「最初は統計ソフトを使わない」については、統計ソフトを使えば計算結果はわかるし……という点について「統計ソフトがやってくれるのは計算だけ」と警鐘を鳴

    論文作成・研究に役立つ 統計学を勉強しよう - はてなニュース
  • 統計検定を理解せずに使っている人のために I - J-Stage

    318 化学と生物 Vol. 51, No. 5, 2013 セミナー室 研究者のためのわかりやすい統計学-1 統計検定を理解せずに使っている人のために I 池田郁男 東北大学大学院農学研究科 319 化学と生物 Vol. 51, No. 5, 2013 1 1 320 化学と生物 Vol. 51, No. 5, 2013 2 μ σ σ 3 * 2 3 * 321 化学と生物 Vol. 51, No. 5, 2013 4 * 5 * 6 σ 4 5 6 σ * * 322 化学と生物 Vol. 51, No. 5, 2013 μ μ μ μ μ σ 7 σ σ σ σ σ σ σ σ σ σ 8 8 9 7 σ 323 化学と生物 Vol. 51, No. 5, 2013 9 10 11 * σ σ * * * * 10 11 * * * * 324 化学と生物 Vol. 51, No.