タグ

analyticsとminingに関するuchiuchiyamaのブックマーク (3)

  • 気象庁のデータが公開されたから1988年と2012年の最高気温推移を比べてみた - noriaki blog はてな出張所

    気象庁が過去の気象データを公開しました 気象庁|過去の気象データ・ダウンロード 2013/05/01に公開されましたが、これはすごいデータですよね。1872年から昨日までのデータが毎日更新されています。140年分もの膨大なデータが表示・ダウンロードできます。 1988年と2012年の年間の最高気温推移を比較してみた というわけでさっそく試してみました。 表示・ダウンロードできる量が「地点数」×「項目数」×「期間」によって制限されているので、1回でダウンロードできる例として1988年から2012年の日別最高気温データをダウンロードしてみました。 日毎の最高気温をプロットしたグラフに7日間の移動平均線を追加して、それぞれの年を比較してみました。2012年の方が最高気温が高く推移しているように見えるかも。特に7〜9月は暑かった。逆に1,2月は気温が上がりきらなかったみたい。 気象庁のデータダウン

    気象庁のデータが公開されたから1988年と2012年の最高気温推移を比べてみた - noriaki blog はてな出張所
    uchiuchiyama
    uchiuchiyama 2013/05/04
    ブログ書いた。気象庁から過去の気象データがダウンロードできるようになったので試してみたよ。
  • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

    データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • @IT Special - 中堅スーパーのデータ活用物語 第2回

    中堅スーパーのデータ活用物語 ~はじまりはExcelのデータだった~ 「BIなんて人ごと」と思っていたシステム管理者の挑戦 第2回 Excelでお手軽データマイニングに挑戦! 県内で全10店舗を運営する地方の中堅スーパー「フクフクドー」。ここでは、さらなる事業成長のための次の一手をどう創り出していくかが目下の課題。営業企画部からの救援要請があり、BI(Business Intelligence)の活用というアイデアの実現に向け一歩を踏み出した。とはいえ、従来型のBIはシステム規模も大がかりで、導入に多大な投資を要するうえ、使いこなすのも困難だと考えているIT部門のシステム管理担当者「番次郎」は慎重な態度を崩さない。最新のBI環境は、こうした慎重論を打破できるだろうか。若い現場担当者の熱意に押される形で、フクフクドーでBI活用の実地検証が始まった。奮闘が始まった。

  • 1