タグ

ブックマーク / gensen.dl.itc.u-tokyo.ac.jp (3)

  • ”専門用語(キーワード)自動抽出システム”のページ

    とりあえず使ってみる方はこちらから! 「言選Web」 "Gensen-Web" (Western Europe language) 「言選Web」(中文版) メインメニュー 1.専門用語(キーワード)自動抽出システムとは? 2.基システム New! 3.応用システム New! 4.関連文献 5.利用統計 2022.12.14 専門用語抽出Node.jsライブラリ termextract-nodejs のβバージョン(0.01b)をリリースしました。 2022.3.9 Python版TermExtractについて、Windows環境に合わせインストール手順を修正しました。python setup.py installからpip install .に変更します。ドキュメントの修正に合わせバージョンを0.02にアップしました。 2023.10.23 "言選Web" 静的サイト(JavaScri

    fumi1
    fumi1 2011/04/22
  • 専門用語(キーワード)自動抽出用Perlモジュール "TermExtract"の解説

    はじめに  テキストデータから、専門用語を取り出すためのPerlモジュール"TermExtract"を解 説します。 日語の文章中から単語を切り出す定番のソフトとして、「茶筅」や「案山子」があ りますが、そのまま専門用語の抽出に使うには次の2つの問題があります。 ひとつは、複合語に対応していないことです。専門用語の多くは単語を組み合わせて、 複雑な概念を表すことが多くなります。特に「茶筅」の場合は単語を品詞単位で細かく 分割するため、そのまま使うには難があります。 もうひとつは、どの用語が重要であるか判断する仕組みを持たないことです。 その問題点を解決したソフトに東京大学・中川裕志教授、横浜国立大学・ 森辰則助教授が作成した「専門用語自動抽出システム」があります。 それは、1)「茶筅」の形態素解析結果を複合語に組み立て、2)その複合語(単語の場 合もある)を重要度の高い順に返すものです。

    fumi1
    fumi1 2008/02/26
  • 専門用語(キーワード)自動抽出サービス 「言選Web」

    このページでは文章中から専門用語(キーワード)を切り出すことができます。文章中から厳選された言葉を選んでくれますからその名の通りゲンセンWebなのです! このシステムは専門用語自動抽出用Perlモジュール"TermExtract"の機能を、Web上で提供するものです。ただしスタンドアロン版と比べて利用できる機能に制限があります。 次のいずれかで専門用語(キーワード)を切り出すデータを指定します。 Web上のhtml化された文章もしくはPDFをURLで指定 文章を直接入力するか貼り付ける Windows上のテキストファイル、もしくはPDFを指定 入力ボックス下のチェックボックスから和文、英文を選択。 専門用語(キーワード)抽出ボタンをクリック しばらくすると専門用語(キーワード)が重要度の高い順に表示される。 ●URL指定は右の欄へ ●文章を入力もしくは貼り付けてる場合は下の欄へ ●お使いの

    fumi1
    fumi1 2008/02/26
    [Mining]
  • 1