タグ

ブックマーク / antibayesian.hateblo.jp (3)

  • 統計屋のためのAWK入門 - あんちべ!

    はじめに 稿はAWKという言語を用いて、 ごく簡単にデータ分析用の前処理*1をするための解説記事です。 AWKは短いコマンドを記述するだけで多様なデータ処理を可能にします。 特にデータの抽出に関して恐るべき簡易さを提供します。 具体的には、input.txtというファイルの中から "fail"という文字列を含む行を抽出したければ次のように書くだけです。 awk /fail/ input.txt つまり、スラッシュ記号で文字列を指定するだけで その文字列を含む行を抽出できるのです。 大変簡単ですね! また、awkはLinuxMacには標準で入っており、 Windowsでもawk.exeを一つ用意するだけなので、 面倒なインストール作業や環境構築は不要で誰でも即座に使えるため、 自分で書いた処理を他人に渡したり*2各サーバに仕込むなども簡単に出来ます。 複雑な処理をする場合はPython

    統計屋のためのAWK入門 - あんちべ!
    yhira0202
    yhira0202 2014/09/15
    Windowsにもawkを入れといてくれれば、楽なんだけどなぁ。
  • 統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!

    稿では統計学・データマイニング・機械学習関連書籍について 内容が易しいこと。数学力(特に微積・線形代数)を求められないこと 入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと 実務に繋げやすいこと。 持ち運びしやすいこと。忙しい新社会人が通勤中や休み時間ポケットからさっと取り出し、継続して勉強出来ること を主眼に選定したお薦め書籍を紹介します。 (満たせない要望も多いですが) 主な対象者は、文系で数学や統計学をやってこなかった、 プログラミングもわからない(Excelで四則演算やマウス操作くらいは使える) けどいつかマーケティングやデータマイニングやってやるぜ! って考えてる新卒の方です。 筆者自身は経済学科出身の文系で、あまり数学力に自信がないなりに Web企業でデータマイニングをしているという人間です。 ここで紹介している内容で 「統計学・機械学習・データマ

    統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!
    yhira0202
    yhira0202 2014/04/01
    キーワード:3D円グラフ。/十年前に知りたかったとか。
  • 退職しました - あんちべ!

    昨日2011年10月31日をもちまして、約2年半お世話になった金融機関を退職しました。退職の旨を周囲にお伝えすると、驚きの声が…全く上がらず、「あんちべは5年もここに居ないだろうなってずっと思ってた」と皆さんから言われました。それどころか「なんでお前初めからベンチャー行かずに、こんな堅苦しい大企業へ来たんだ?」と問われること多数(どころか十中八九聞かれる始末…)。現職を選んだのには理由がありました。それは高校時代に遡ります。 「モノづくりをして、技術で皆さんの生活をハッピーにしたい!」という思いから、進学校ではなく、某工業大学付属高校へ入学しました。技術を学ぶのは楽しく、そのまま技術屋になろうと考えていました…が、地元の工場見学で社会人と接するにつれ、徐々に「現場でどんなに頑張っても、マネジメントやそもそもの経営が上手くいってないと詮無いのでは…」という思いが募り、進路に悩みました。 そん

    退職しました - あんちべ!
  • 1