2018年12月21日のブックマーク (4件)

  • signate「国立公園の観光宿泊者数予測」コンペで10位でした - u++の備忘録

    記事は、kaggle Advent Calendar 2018 その2の21日目の記事です。 qiita.com はじめに 但し書き コンペの概要 関連コンペ 特徴 日付に関する特徴 公共交通検索ログデータに関する特徴 カテゴリ変数 気象データに関する特徴 使わなかったデータ モデル その他の試行錯誤 結果 おわりに はじめに signateで開催されていた「国立公園の観光宿泊者数予測」コンペに参加し、10位でした。 signate.jp 参加者は471人、一度でも投稿した人が124人だったので、それなりの順位ではありますが、上位陣と大幅に差をつけられてしまい個人的には非常に残念な結果となりました。 記事では、備忘録も兼ねて、私の解法をまとめておきたいと思います。 但し書き 記事は、signate「国立公園の観光宿泊者数予測」の参加規約を遵守した範囲で作成しています。 https:/

    signate「国立公園の観光宿泊者数予測」コンペで10位でした - u++の備忘録
  • POS・IDPOS分析を行う際に気を付けること | データ分析とインテリジェンス

  • GCPとDockerでKaggle用計算環境構築 - Qiita

    Kaggle Advent Calendar 13日目の投稿です。 初めまして、Lain(@lain_m21)と申します。Qiita初投稿です! 今回はKaggle関連のトピックで何か短いのを一書こうと思い、私が普段行なっているコンペ用の環境構築についていくつか良いなと思ったtipsをシェアしたいです。 先に結論からまとめておくと、 ローカルPCよりクラウドの計算資源をうまく使おう AWSもいいけど、GCPの方が目的に応じてインスタンススペックを細かくチューニングできるので良いぞ 今後のクラウドの環境構築をスムーズにするためにdockerを使おう といった感じです。昨今のコンペの規模を考えるとクラウドで計算することが増えると思うのですが、いちいちコンペごとに環境構築したりめんどくさいと思うので、できるだけdockerで自動化して楽しよう!というのが趣旨になります。 一応順を追って説明しま

    GCPとDockerでKaggle用計算環境構築 - Qiita
  • 「政府統計」で相次ぐ不祥事、データは本当に信用できるのか

    昭和47年静岡県生まれ。静岡聖光学院高校卒業、国際基督教大学(ICU)教養学部卒業、慶應義塾大学大学院法学研究科修了(法学修士)。 総務省、株式会社三井物産戦略研究所、デロイトトーマツコンサルティング合同会社、みんなの党代表(当時)渡辺喜美衆議院議員政策担当秘書、外資系コンサルティング会社等を経て、政策コンサルタントとして独立、室伏政策研究室(「◯◯と政策をつなぐ研究室」)を設立し現在に至る。 政財官での実績を生かし、国会議員、地方議員の政策アドヴァイザーや民間企業・団体向けの政策の企画・立案、対政府渉外活動の支援、政治・政策関連のメディア活動等に従事。 DOL特別レポート 内外の政治や経済、産業、社会問題に及ぶ幅広いテーマを斬新な視点で分析する、取材レポートおよび識者・専門家による特別寄稿。 バックナンバー一覧 最近、政府の統計データに関する不祥事が相次いで発覚している。これら統計調査は

    「政府統計」で相次ぐ不祥事、データは本当に信用できるのか
    Ez-style
    Ez-style 2018/12/21
    “基幹統計”ってなんだ、“指定統計”じゃないのか、と思ったけど、法改正で分類が変わってたのか。しかも10年前。。。