タグ

データマイニングに関するteitei_tkのブックマーク (2)

  • 性的欲望をかきたてるものは人によってこんなに違う

    <検索エンジンに打ち込まれた性的な語句のリストを見るだけでも、人の性嗜好がいかに多種多様かわかる。インターネットを情報源にした、ボストン大学の認知神経科学者2人による性的欲望の研究より> 性的欲望を生み出す脳のソフトウエアはどんなしくみになっているのか? そんな疑問を抱いたボストン大学の認知神経科学者、オギ・オーガスとサイ・ガダムは、インターネットを情報源に使って「世界最大の実験」を行い、1冊のを世に送り出した。『性欲の科学――なぜ男は「素人」に興奮し、女は「男同士」に萌えるのか』(坂東智子訳、CCCメディアハウス)だ。 4億の検索ワード、65万人の検索履歴、数十万の官能小説、数千のロマンス小説、4万のアダルトサイト、500万件のセフレ募集投稿、数千のネット掲示板投稿――これらをデータマイニングにより分析した彼らは、読み物としても濃密な1冊に仕上げている。 ここでは書の「第1章 大まじ

    性的欲望をかきたてるものは人によってこんなに違う
  • hadoopの話とpythonでデータマイニングをする話 - gumi Engineer’s Blog

    gumiの粟飯原です。 データマイニングやってます。しかしながら最近はあまりデータをいじる時間がなく社内でプレゼンばかりする日々で、社内でも私がなにやってるのかわからないというもっぱらの評判。そこで今回は一応データ解析もやってはいるんだよということを内外に主張するためにもデータマイニングの話をしようと思います。 アプリの基的な日々の統計データ取得などは別の方々はやられているので、私からはhadoopを使った大規模解析の話や、そこで得られたデータを分析する環境の話をしたいと思います。コードを併記した具体例などは今回載せられないのですが、今後また紹介していければと思います。 大規模データの解析 日々のログ解析やDB解析はcronによる処理で毎朝レポーティングを行っているのですが、新しい情報を過去のアクセスログからまとめてどかんと取得したいと言う時はHadoopによる大規模解析を実行しています

    hadoopの話とpythonでデータマイニングをする話 - gumi Engineer’s Blog
  • 1