タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

形態素解析に関するvas-animatumのブックマーク (2)

  • ”専門用語(キーワード)自動抽出システム”のページ

    1.専門用語(キーワード)自動抽出システムとは? 当サイトでは、専門用語(キーワード)自動抽出システムの基システムおよび応用システムを提供しています。 専門用語(キーワード)自動抽出システムとは、単なる文章の単語分割ではありません。一般に文章中では複数の単語の組み合わせで複雑な概念を表す場合が多く、文章の内容が専門的な事項に特化すればその傾向はさらに顕著なものとなるでしょう。したがって文章中からキーワードを抽出する場合、単語分割機能だけでは意味を成しません。そこで、このシステムでは、(1)形態素解析プログラムによる単語分割、(2)複合語の作成、(3)文章中における重要度の計算、という3つのステップを踏むことで、複合語により複雑な概念を表すことが多い専門用語をキーワードとして文章中から抽出することに成功しました。 自作の文章からキーワードを抽出したい! メタデータ作成のためにウェッブサイト

  • 日本語文書の文字・単語出現頻度解析ツールとデータ

    さて、この方法で、単語単位での解析結果から前述のような「板同士の類似度」を計算してみたところ、今度は感覚的に「精度が低い」結果が出ました。機械的に漢字のみを数え上げたものよりも高精度が出せると思っていたところだったのですが、内容の関連性のあまり見えない板が、「『総合』スレッドが多い」などといった関係で浮かび上がってくるのです。さらに、独特の用語や新しい固有名詞の使われているサンプルには、KAKASIの辞書をそのまま使うのは不適切であったという部分もあります。しかし、文字のみよりも形態素単位のほうが、解釈としては「質的」に文章の「内容」に近づくという考え方は捨てきれません。何らかの補正をかけて、高精度を出すことは可能かもしれません。 個人レベルで利用できるツール ここまでは、自作ツールを用い、「2ちゃんねる」をサンプルとした解析結果 を紹介しましたが、次は、個人レベルで利用できる解析ツール

  • 1