[B! データマイニング] t_otodaのブックマーク

t_otoda id:t_otoda

データマイニングに関するt_otodaのブックマーク (9)

Apache Sparkってどんなものか見てみる（その１ - 夢とガラクタの集積場
こんにちは。 Kafkaを試している最中で微妙ですが、最近使えるのかなぁ、と情報を集めているのが「Apache Spark」です。 MapReduceと同じく分散並行処理を行う基盤なのですが、MapReduceよりも数十倍速いとかの情報があります。・・・んな阿呆な、とも思ったのですが、内部で保持しているRDDという仕組みが面白いこともあり、とりあえず資料や論文を読んでみることにしました。まず見てみた資料は「Overview of Spark」（http://spark.incubator.apache.org/talks/overview.pdf）です。というわけで、読んだ結果をまとめてみます。 Sparkとは？高速でインタラクティブな言語統合クラスタコンピューティング基盤 Sparkプロジェクトのゴールは？以下の2つの解析ユースケースにより適合するようMapReduceを拡張
t_otoda 2013/09/02
MapReduce

apache

Scala

hadoop

spark

機械学習

アルゴリズム

データマイニング
リンク
Webデータ分析＆データサイエンスで役立つ統計学・機械学習系の分析手法10選 - 銀座で働くデータサイエンティストのブログ
追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。主に自分向けのまとめという意味合いが強いんですが（笑）、僕が実際に2013年6月現在webデータ分析＆データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。追記回帰分析（特に線形重回帰分析）独立性の検定（カイ二乗検定・フィッシャーの正確確率検定）主成分分析(PCA) / 因子分析クラスタリング決定木 / 回帰木サポートベクターマシン(SVM) ロジスティック回帰ランダムフォレストアソシエーション分析（バスケット分析・相関ルール抽出）計量時系列分析おわりにおまけ1：「素性ベクトル＋分類ラベル」なるデータ前処理おまけ2：グラフ理論*10 {igraph}パッケージでグラ
t_otoda 2013/06/11
機械学習

web

データマイニング

marketing

analytics

統計
リンク
アドファイブDSP/RTBのアーキテクチャ
Statistics Likes 3 Downloads 5 Comments 0 Embed Views 0 Views on SlideShare 75 Total Views 75 アドファイブDSP/RTBのアーキテクチャ Presentation Transcript アドファイブDSP/RTBのアーキテクチャアドファイブ（株）代表礒部正幸第26回データマイニング+Web@東京発表資料（2013/05/18 ニフティ） RTBの概要• RTBとは– ディスプレイ広告を１インプレッション毎にオークションによって買い付ける仕組み– メディア側（SSP・アドエクスチェンジ）がオークションを開催（リクエスト発行）し、広告主側（DSP）が入札と落札時の広告配信を行うSSP /AdEXDSPRTBプロトコル②リクエスト（オークション情報）③レスポンス（入札情報）・RTBプロトコル
t_otoda 2013/05/19
DB

データマイニング

web

statistics

presentation

development

dsp

ssp

ad

slifeshare
リンク
情報抽出入門〜非構造化データを構造化させる技術〜
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EM NLP 2021)Deep Learning JP
t_otoda 2013/05/17
slideshare

presentation

データマイニング

jubatus

自然言語処理

statistics
リンク
サービス終了のお知らせ - NAVER まとめ
サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。
t_otoda 2012/09/10
機械学習

データマイニング

NAVER

まとめ
リンク
テキストマイニング技術の活用に向けて読んでおきたい12のプレゼン資料 - コーパスいぢり〜langstatの研究日誌〜
中年以降の人生を考えるための５冊今までずっと、ひたすらラクなことや楽しいことだけをやって生きていきたいと思っていたのだけど、40歳を過ぎた頃から、今までのやり方ではいろいろと行き詰まってくるようになってきました。何をやってもそんなに楽しくない。これからの人生はずっと下り坂が続いてい…
t_otoda 2012/05/07
あとで読む

機械学習

データマイニング
リンク
Hadoop conferencejapan2011
スキーマレスカラムナフォーマット「Yosegi」で実現するスキーマの柔軟性と処理性能を両立したログ収集システム / Hadoop / Spark Con...Yahoo!デベロッパーネットワーク
t_otoda 2012/01/24
ameba

ログ

データマイニング

hadoop
リンク
『モバゲーの大規模データマイニング基盤におけるHadoop活用』－Hadoop Conference Japan 2011－ #hcj2011
『モバゲーの大規模データマイニング基盤におけるHadoop活用』－Hadoop Conference Japan 2011－ #hcj2011 2011/02/22 [登壇後エントリ] ：" 「モバゲーの大規模データマイニング基盤におけるHadoop活用」－Hadoop Conference Japan 2011 #hcj2011 で登壇してきました " http://d.hatena.ne.jp/hamadakoichi/20110222/p1Read less
t_otoda 2012/01/24
データマイニング

hadoop
リンク
ソーシャルゲームログ解析基盤のHadoop活用事例
【エンジニアカフェEvent×gumiStudy】ソーシャルゲームの解析を支える技術-Hadoop編- http://www.facebook.com/event.php?eid=245262765524522 の発表資料です。
t_otoda 2012/01/24
hadoop

slideshare

mongodb

データマイニング
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx