タグ

ブックマーク / kkimura.hatenablog.com (7)

  • MLC toolbox: MATLAB/Octave用のマルチラベル分類ライブラリ - 楡楡

    記事を非公開にしてたけど,いま少し頑張っていることを書くことにする. マルチラベル分類 従来の分類問題は一つのデータ点(インスタンス)は一つのクラスのいずれかに属するという設定. マルチラベル分類は一つのインスタンスが一つ以上のクラスに属するという設定. 割り当てがラベルの組み合わせの数だけ存在するので比較的難しいよねという話.(おおざっぱにいえば マルチラベル分類のライブラリ 色んなところで色んな人が公開している. 有名なのは Mulan http://mulan.sourceforge.net/ MEKA http://meka.sourceforge.net/ 特にMulanはデータセットを公開しているので(arff形式だが)非常によく引用されている. これらはJavaのWekaというデータマイニングライブラリをベースに実装されている. しかし一方で,個人がいろいろと公開しているもの

    MLC toolbox: MATLAB/Octave用のマルチラベル分類ライブラリ - 楡楡
  • ICDM参加報告 - 北の大地から

  • Robust NMF 論文リスト(適当版) - 北の大地から

    2016 - 08 - 29 Robust NMF 論文リスト(適当版) Robust NMFについて,Robustという言葉が混じっている論文のリスト. 把握しきれていないけど読んで実装して実験環境もあわせて可能な限り公開していきたい. Robust NMF NMFは主にFrobenius normの二乗かKL-divergenceを用いた目的式の最適化を行う. しかし,これらはGaussian NoiseとPoisson Noiseを考慮した場合において最適になるモデル. そのため,ある値が極端に変な値を取るようなImpulse noiseや Laplace noiseに対しては頑健じゃない. 具体的には,Frobinus normの二乗を目的式に用いた場合,2乗で評価されるために極端な値に引っ張られるということがおきる. Robust NMFはこれらのnoiseに対してr

  • Qpass: a Merit-based Evaluation of Soccer Passes (KDD2016workshop)を読んだ - 北の大地から

    2016 - 08 - 14 Qpass: a Merit-based Evaluation of Soccer Passes (KDD2016workshop)を読んだ サッカーの解析は面白いし今後も追っていきたい.(いつかは少し触ってみたいけど,サッカーの戦術に詳しくないので...) ということで KDD のLarge Scale Sports Analyticsというworkshopで発表される(された)Qpassを読んだ. 論文は http://www.large-scale-sports-analytics.org/Large-Scale-Sports-Analytics/Submissions.html から手に入る. モチベーション サッカー選手のパス能力の解析を行いたい. 今までのサッカーのパスの評価は アシスト数 キーパス(チャンスを作ったパスの数) パス成功の割合(成功

  • NMFアルゴリズムの紹介 その① HALS - 北の大地から

    2015-10-04 NMFアルゴリズムの紹介 その① HALS 昨日は,NMFの簡単なまとめをしたが,今回は,その一つの手法を取り上げることにします. 当はMultiplicative Update ruleを最初に取り上げるべきなのでしょうが, 既に多くの記事で取り上げられているので,同じ内容を二度もやる必要はないだろうということで省きます. わかりやすい記事としては, Non-negative Matrix Factorization(非負値行列因子分解) - あらびき日記 Natureの例などを載せてくれていて,非常にわかりやすいです. smrmkt.hatenablog.jp リコメンデーション等の例もあり,直観的にわかる内容の記事になっています.なんとなくNMFを試してみるかという場合は,Multiplicative Update ruleで問題ありません. し

  • Dynamic Matrix Factorization with Priors on Unknown Values (KDD 2015)を読んだ - 北の大地から

    2015-10-10 Dynamic Matrix Factorization with Priors on Unknown Values (KDD 2015)を読んだ 読んだ論文をまとめることにする. 便所糞虫先生の記事のようなわかりやすいものを目指して. 糞ネット弁慶とりあえず,テンプレはイメージこんな感じで. モチベーション コントリビューション 問題設定 提案法 実験 所感 少しずつ改良していきたいと思います. 読んでいく論文の方針というか傾向ですが, 研究の興味がRecommendationとかなので,KDDやICDMとかRecSysやWSDMといったところから論文を適当に拾ってきて読みます. WSDMはWisdomって発音するらしい.洒落ていますね.(真顔今回は Dynamic Matrix Factorization with Priors on Unknown

  • NMFアルゴリズムの紹介 その② GCD - 北の大地から

    2015-10-05 NMFアルゴリズムの紹介 その② GCD 研究が進んでいないので,記事を書いて,モチベーションを高めることに.... 今回の紹介アルゴリズムはNMFで現在(2015年10月)で最速といわれている(筆者の知る限り)手法Greedy Coordinate Descent Algorithmの紹介です. 元論文は, Hsieh, C.-J., & Dhillon, I. S. (2011). Fast coordinate descent methods with variable selection for non-negative matrix factorization. In ACM SIGKDD (pp. 1064–1072). https://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3

  • 1