LDAに関するozw3253t2c0390aのブックマーク (3)

  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
  • KDD2012軽くメモ - 糞糞糞ネット弁慶

    A Probabilistic Model for Multimodal Hash Function Learning A probabilistic model for multimodal hash function learning 目的 近傍探索を行う際に用いられる Hashing について,Hash Function Learning について複数ジャンルのデータを扱えるようにする枠組みを提案. 生成モデルで hash function をアレするので良い. モデル 例として X と Y の bimodal (例:文書と画像)を考える.観測変数はX内の変数間における類似度が入った行列,Y内の変数間における類似度が入った行列,及びX-Y間の要素が関連しているかどうかの0/1が入った行列の三種類.はアノテーションとかで付与されるものとイメージする. グラフィカルモデルにおいて, U/

    KDD2012軽くメモ - 糞糞糞ネット弁慶
  • LDAについて

    トピックモデル(今回はLDA: 潜在的ディリクレ配分法)について、今後自分で実装したり研究に生かしたりしたいと思ったので、 すごく簡単な例で考えてみました。(肝心なD(ディリクレ分布)についてはスルーしている・・・汗) 何か間違いとか指摘とかあれば教えて頂けると嬉しいです。 トピック 同じ文書内で使われる確率が高いような、似た意味を持つ単語の集まり。 例えば政治のトピックなら、「選挙」「国会」「内閣」が出やすい。 トピックモデルでは、文書のトピック(文書で、どのトピックがどのくらい出やすいか)と、 トピックの単語(トピックで、どの単語がどのくらい出やすいか)を求める。 参考URL: http://sucrose.hatenablog.com/entry/20120322/p1 以下、具体例を用いて具体的に流れを追ってみる。 参考URL: http://blog.echen.me/2011/

    ozw3253t2c0390a
    ozw3253t2c0390a 2015/04/28
    すごくわかりやすい
  • 1