タグ

データマイニングに関するmstk-oのブックマーク (2)

  • 固定長データをcsvにするには? - kingqwertの覚書

    研究, データ最近、2GBとかくらいの固定長データをcsvにしてみんなに渡さないといけない、という事態がちょいちょい発生しますのでそのメモ。 ぶっちゃけ、RだろうがStataだろうがなんでも固定長データの読み込みはできますが、いかんせん遅い!のでまずはスクリプト言語でサクッと変換しちゃおう!というのが目論見です。 さて、そうなるとpythonperlか、その辺かな?というわけですが、今回はgawkというやつを使いたいと思います。このなかのFIELDWIDTHS というものがいいようです。 まずは、ここからダウンロード。一番新しいやつの.tar.gzでいいのではないでしょうか。そして展開しておいてください。ちなみに、Mac向け。XcodeとCommand line toolは事前にダウンロードしておいてください。 cd gawk-3.1.1 ./configure make sudo ma

  • 非エンジニアにもわかるR言語で何ができるか?【データマイニング】 その2 | Sanow Labs blog(サノウラボブログ)

    GMOアドパートナーズ(株)がソーシャルメディア・Web広告戦略を提供するラボサイト!Web広告のトレンドや、SEO/SEM、ソーシャルメディアの最新手法の紹介から、ニュース、インタビュー記事等を掲載していきます。実績を通じて得た経験や専門的且つ、実践的なテクニックを活かして、他社の先を行く実効性のあるマーケティング戦略論を提供します。はじめに 「風が吹けば桶屋が儲かる」 この言葉の意味をご存知でしょうか。何故、風が吹くと桶屋が儲かるのでしょう。 大風で土埃が立つ →土埃が目に入って盲人が増える →盲人は三味線を買う →三味線に使う皮が必要になり、が殺される →が減れば鼠が増える →鼠は桶をかじる →桶の需要が増え桶屋が儲かる ある事象の発生により、一見すると全く関係がないと思われる物事に影響が及ぶという日古くから伝わることわざです。また、現代でも連関規則の有名な例とし

    非エンジニアにもわかるR言語で何ができるか?【データマイニング】 その2 | Sanow Labs blog(サノウラボブログ)
  • 1