タグ

miningに関するde-styleのブックマーク (1)

  • テキストの多重トピック抽出技術|NTT

    現在、インターネットに代表されるように、膨大なテキストが電子的に蓄積されつつあります。検索をより柔軟に行うためには、テキストの分類が必要です。しかし、人手によるテキスト分類の時間と労力を削減するために、テキストの自動分類技術が渇望されています。研究では、テキストが帰属するトピックを多重を許容してパソコンで実時間かつ高精度に抽出する技術を考案しました。多重トピックを同時に抽出する技術は世界初で、さらに抽出精度も実際のwebページを用いた実験において従来手法より優れていることを確認しています。 今後はトピックの体系そのものを自動生成する技術を検討する予定です。 多重トピックテキストの確率モデルを世界で始めて考案 モデルのパラメータ学習の最適性を理論保証 トピック抽出はパソコンで実時間で実現可能 アルゴリズムの実装は容易 多重トピックを同時に抽出する技術は世界初 web

  • 1