タグ

miningとresearchに関するaskmtのブックマーク (5)

  • テキストマイニング技術の活用に向けて読んでおきたい12のプレゼン資料 - コーパスいぢり 〜langstatの研究日誌〜

    「遊び」をクリエイトするAI デスピサロを相手に、効くはずのないザラキを唱えまくるクリフトを見ながら、AIというのはなんてアホなのだろうと思った。多分、それが、僕が初めてAIに出会った瞬間だったと思うのだけど、時は過ぎ、現代では生成AIを中心とした「かしこいAI」たちが世に溢れていて、…

    テキストマイニング技術の活用に向けて読んでおきたい12のプレゼン資料 - コーパスいぢり 〜langstatの研究日誌〜
  • 大規模データマイニング・機械学習 Mahout 活用に向けて読んでおきたい12のプレゼン資料 - hamadakoichi blog

    2012年度が始まり1ヶ月が経ちました。2011年度は、大規模分散処理技術・データ基盤の普及が広く進んだ年だったと思います。2012年はそれら蓄積された大規模データを活用しデータマイニング・機械学習を用い、ビジネス・サービス洗練を大きく広げていく年ではないでしょうか。 Mahoutは 大規模分散データマイニング・機械学習のライブラリです。ApacheプロジェクトのOpen Sourceで、Hadoop上で動作しデータマイニング・機械学習の大規模分散実行を行うことができます。 Apache Mahout 大規模分散 データマイニング・機械学習を実行できる Mahout ですが、まだ「ドキュメント整備が発展途上で詳細を知るためにはソースコードから読み解く」必要がある場合が多く、また、活用には「対象とするデータマイニング・機械学習の基礎知識」が必要なため、まだまだ活用の敷居が高いのが現状ではない

    大規模データマイニング・機械学習 Mahout 活用に向けて読んでおきたい12のプレゼン資料 - hamadakoichi blog
  • 自由回答データを定量的な切り口で分析するには? ― @IT情報マネジメント

    Webなどを通じて、顧客や利用者の意見を集めることが簡単にできるようになってきた。しかし、非定型の自由回答データは非常に有意義な意見を得ることができる反面、分析するのに手間が掛かる。手軽に定量分析する方法はないだろうか? Webや電子メール、ケータイの普及で、幅広くさまざまな意見を募ることが安上がりにできるようになってきました。最近ではブログやSNSなどのCGMと呼ばれる口コミ系メディアも花盛りです。 Webアンケートも広く行われていますが、アンケートの回答は「出題側の仮説に影響される」という制約があり、“意外な発見”にはなかなか結び付きません。 一方、メールなどで寄せられる自由回答や意見・要望はそうした制約もなく、何かビジネスのヒントがありそうですが定量的な分析ができないという弱みがあります。せいぜい分析者が文章を読んで主観的に解釈するぐらいにしか活用していないのではないでしょうか? あ

  • グラフマイニング : kinjoblog

    2005年04月22日21:24 カテゴリ●datamining グラフマイニング バイト後に都内だったのでついでに統計数理研のISMオープンフォーラムにいってきました。研究所のある広尾ってところは周囲に大使館とかがあるっぽくなんか外国人のひとが多くて独特の雰囲気があってよかった。内容は、鷲尾隆さんによる構造データからのマイニングであるグラフマイニングのはなし。AGMというアルゴリズムの話しが中心。ほかにもGBIといった手法も提案していたようだ。構造からのマイニングというと、ILPが古くからやられているが計算の都合上検出できるグラフが2,3ノードが限界らしく、それで表現力は劣るかもしれないがこういった高速アルゴリズムが提案されている。基としては相関ルールに用いられているアプリオリアルゴリズムを基にしたもので検出できるノードが10〜20までとなっている。具体的にどういったことに使えるかとい

    グラフマイニング : kinjoblog
  • Homepage for Mining Structured Data

    What is "Mining Structured Data"? Given a database of structures, an algorithm for mining structured data is an algorithm that searches for interesting information in these structures. Examples of structures are graphs, trees, molecules, XML documents and relational databases. At the moment this homepage concentrates on algorithms that search for descriptions of structures. Descriptions may be su

  • 1