1. 異常行動検出入門(改) - 行動データ時系列のデータマイニング - @yokkuns: 里 洋平 yohei0511@gmail.com 2012.05.11 機械学習 プログラミング勉強会 2012年5月12日土曜日
Tokyo.R勉強会に行ってきました。 内容盛り沢山で、刺激的ですね。 個人的には時系列分析を行うxtsパッケージとgoogleVisとの連携が実践的に使えそうに思いました。 xts(zoo)のローリング機能はリサーチ(POS等の小売データなど)では有用ですし、googlevisとの連携は顧客によってはレポートとして魅力的ですね。 ===============(以下メモ)=============== ○生存時間分析 -2種類の打ち切り(censered data) -ハザード関数 -ノンパラ、セミノンパラ、パラメト(共変量、分布の過程) -ノンパラ:確率分布を仮定しない(共変量、分布仮定しない) -経験分布(カプランマイヤー)、ハザード関数 -survival -surv,survfit -信頼区間推定→群間差分の検討?なのか? -セミノンパラ:コックス比例ハザード -複数共変量の検討
3. AGENDA ● 自己紹介 ● 異常行動検出 ● サイバー犯罪の検出 ● ナイーブベイズによる異常行動検出 ● 異常行動検出エンジン AccessTracer ● 応用例 ● 最後に
12. 自己紹介 ● 名前 : 里 洋平 ● ID : yokkuns ● 職業 : データマイニングエンジニア
7. サンプルデータの作成「df」コマンドを使用します。$ dfFilesystem 1K-ブロック 使用 使用可 使用% マウント位置/dev/vzfs 83886080 4738368 79147712 6% /none 262144 4 262140 1% /dev 8. こんな感じのシェルスクリプトを作って#!/bin/bashdatetime=`date ‘+%F %H:%M’`# 日付values=`df | awk‘/devvzfs/ {print $2“,”$3“,”$4}’`# 観測値echo $datetime,$values# まとめて出力cronで定期的に動かして、ログに保存$ crontab -l* * * * * ~/df.sh >> ~/df.log 2> /dev/null最初にヘッダを入れておくと良いかも$echo "datetime,blocks,use
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く