タグ

Perlとツールに関するkatowのブックマーク (2)

  • Windows用テキストマイニングツール"termmi"

    はじめに "termmi"はWindows上のテキストファイルの専門用語を複数ファイル間で比較するシステムです。Windows専門用語抽出システム"termex"を用いても複数ファイル間の比較は行えますが、重要度の比較が行いにくいなどの問題がありました。テキストマイニング専用に作成した"termmi"を使うことにより複数ファイル間の重要度の数値比較を有意に行えるだけではなく、各文献の共通部分などさまざ まな比較結果を求めることができます。 機能と使い方 1.複数のテキストファイル(Shift-JIS)を入れたフォルダを、termmiのアイコンにドラッグ&ドロップします。 (和文の場合は「専門用語分析(和布舞)」アイコン、 英文の場合は「専門用語分析(英文)」アイコンになります) 2.termmiの各サブフォルダに処理結果が保存されます。内訳は次のとおりです。 (1)outputフォルダ 処

    katow
    katow 2009/06/26
    termmiというテキストマイニングツール
  • ”専門用語(キーワード)自動抽出システム”のページ

    1.専門用語(キーワード)自動抽出システムとは? 当サイトでは、専門用語(キーワード)自動抽出システムの基システムおよび応用システムを提供しています。 専門用語(キーワード)自動抽出システムとは、単なる文章の単語分割ではありません。一般に文章中では複数の単語の組み合わせで複雑な概念を表す場合が多く、文章の内容が専門的な事項に特化すればその傾向はさらに顕著なものとなるでしょう。したがって文章中からキーワードを抽出する場合、単語分割機能だけでは意味を成しません。そこで、このシステムでは、(1)形態素解析プログラムによる単語分割、(2)複合語の作成、(3)文章中における重要度の計算、という3つのステップを踏むことで、複合語により複雑な概念を表すことが多い専門用語をキーワードとして文章中から抽出することに成功しました。 自作の文章からキーワードを抽出したい! メタデータ作成のためにウェッブサイト

    katow
    katow 2009/06/26
    キーワード抽出処理
  • 1