タグ

ブックマーク / gensen.dl.itc.u-tokyo.ac.jp (2)

  • Perlモジュール Lingua::LanguageGuesser のお試しページ

    Perlモジュール Lingua::LanguageGuesser の お試しページです Webページもしくは指定したテキストが何の言語で書かれているかを判定します。なお、このWebアプリケーションは、自作のPerlモジュール Lingua::LanguageGuesser を 元にしています。 Usage 次のいずれかの方法で言語判定を行うテキストを指定してください。 WebページのURLを指定 テキスト欄にコピー&ペーストなどでテキストを入力 パソコン上のファイルを指定 (フラットなテキストファイルとHTMLに対応しています) "判定"ボタンをクリックします しばらく待つと、もっとも統計的に可能性が高い言語と、類似度の高い順に並んだ各言語の一覧が表示されます。 ●URLを入力してください ●文章をコピー&ペーストなどで入力してください ●パソコン上のファイル(フラットなテキストファイル

    youpy
    youpy 2009/02/05
    言語判定
  • ”専門用語(キーワード)自動抽出システム”のページ

    1.専門用語(キーワード)自動抽出システムとは? 当サイトでは、専門用語(キーワード)自動抽出システムの基システムおよび応用システムを提供しています。 専門用語(キーワード)自動抽出システムとは、単なる文章の単語分割ではありません。一般に文章中では複数の単語の組み合わせで複雑な概念を表す場合が多く、文章の内容が専門的な事項に特化すればその傾向はさらに顕著なものとなるでしょう。したがって文章中からキーワードを抽出する場合、単語分割機能だけでは意味を成しません。そこで、このシステムでは、(1)形態素解析プログラムによる単語分割、(2)複合語の作成、(3)文章中における重要度の計算、という3つのステップを踏むことで、複合語により複雑な概念を表すことが多い専門用語をキーワードとして文章中から抽出することに成功しました。 自作の文章からキーワードを抽出したい! メタデータ作成のためにウェッブサイト

    youpy
    youpy 2005/09/07
  • 1