タグ

データマイニングに関するkan_highのブックマーク (2)

  • (道具としての)データサイエンティストのつかい方

    2. ⾃自⼰己紹介 l  ⽐比⼾戸将平(HIDO Shohei) l  TwitterID: @sla l  専⾨門:データマイニング、機械学習 l  経歴: l  2006-2012: IBM東京基礎研究所データ解析グループ l  機械学習(特に異異常検知)のアルゴリズム研究開発 l  お客様案件でデータ解析プロジェクトに従事 l  2012-: 株式会社プリファードインフラストラクチャー l  ⼤大規模オンライン分散機械学習基盤Jubatusチームリーダー l  趣味 l  京都(京都検定三級) l  寺社仏閣巡り(⻄西国・洛洛陽三⼗十三観⾳音霊場満願) l  茶茶道(裏裏千家) 2 l  野外⾳音楽フェス(フジロック⾏行行きたい!!!)

    (道具としての)データサイエンティストのつかい方
  • 超「スモールデータ」 – Fujimura Seminar

    早速ですが、先ず114の品のネットワーク可視化結果をご覧下さい。この結果は、114の品に対して5段階で好きか嫌いかを被験者に尋ねるWebアンケートにより収集したデータで作ったものです。 この可視化は、まず評価者を行、品を列とする行列を作り、その列ベクトル同士がどれだけ近いかをコサイン類似度で計算して、お互いに類似度が高い品同士をエッジで接続します。そしてGephiと呼ぶネットワーク可視化ツールでエッジで接続されているノード同士がお互いに近くなるように2次元平面上に配置したものです。これはマイニングの教科書にある古典的な方法で特に何の工夫もありません。それでも、似たような品がお互いに近くにまとまっていることがわかります。お刺身類は右、野菜は下、洋は左、麺類と天ぷらが上、という具合です。 同様に、下の階層的クラスタリングの結果をご覧下さい。こちらはコサイン類似度ではなくユークリッド

  • 1