fjwr38のブックマーク - はてなブックマーク

統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ！
本稿では統計学・データマイニング・機械学習関連書籍について内容が易しいこと。数学力（特に微積・線形代数）を求められないこと入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと実務に繋げやすいこと。持ち運びしやすいこと。忙しい新社会人が通勤中や休み時間ポケットからさっと取り出し、継続して勉強出来ることを主眼に選定したお薦め書籍を紹介します。（満たせない要望も多いですが）主な対象者は、文系で数学や統計学をやってこなかった、プログラミングもわからない（Excelで四則演算やマウス操作くらいは使える）けどいつかマーケティングやデータマイニングやってやるぜ！って考えてる新卒の方です。筆者自身は経済学科出身の文系で、あまり数学力に自信がないなりに Web企業でデータマイニングをしているという人間です。ここで紹介している内容で「統計学・機械学習・データマ
fjwr38 2014/04/27
リンク
SPSSで簡単テキストマイニング - あんちべ！
SPSSで簡単テキストマイニング View more presentations from SPSSはPythonと連携することが出来ます。SPSSは大変多機能ですが、業務で実際扱うデータは一筋縄にはいきません。様々な前処理が必要です。SPSSに落とし込めるよう、データの整備やクリーニングをPythonで簡単にやってしまいましょう。今回はテキストをSVMにかけるための下準備をPythonで行います。形態素解析にはMeCab-野良ビルドを用います。まずは頻度カウントしてみます #coding:utf-8 import sys import MeCab #MeCabを呼んで使えるようにする tagger = MeCab.Tagger("-Owakati") #分かち書きをする指定 read_file = sys.argv[1] #コマンドラインから読み込むデータファイルを指定する all_te
fjwr38 2012/04/19
python

プログラミング

テキストマイニング
リンク
新社会人の君へ-disるということについて - あんちべ！
「ご趣味は？」と聞かれて「Lispをdisることですね（ｷﾘｯ」と答えてしまい、合コン開始4秒で蚊帳の外に放り出されるあんちべです、こんばんは。今から長い文章を書く。結論だけさっさと言っちゃうと「まぁ、初めのうちは、あんまり『○○は使えない』とかdisらない方が良いよ」の一言だ。さぁ、それで話しはおしまい。もし暇だったら続きも読んで欲しい。（あと、この文章はたった一人のために書いた。ちょっと妙に聞こえるところもあるだろうけど、そこは聞き流して欲しい）私はよくいろんなものを嫌いだ嫌いだとdisる。にわかベイジアンが嫌い（話すと長くなる）、Javaが嫌い（JVMは愛してる）、Perlが嫌い、 MavenとかCVSとかが嫌い、アジャイルアジャイル言ってる人が嫌い（アジャイルが嫌いなわけじゃないよ）… 言い出したらキリがない！毎日新しいdisりの種が沸いてくるんだ！何度か様々な
fjwr38 2012/04/04
自分はこの段階には全然至ってないけども、忘れないようにしたい

アジャイル

考え方

work
リンク
1