[B! 言語] keyesberryのブックマーク

tf・idf法

は,ある語tがある文書d中に現れる頻度をで割った値である．はセグメント内の形態素数であり，セグメント長を反映した正規化を行なっている．は，文書データベース全体においてある語tが現れる文書の頻度に基づく値であり，次式で定義される．はある語tが一部の文書に集中している度合を表しているので，はある語tがある文書dを弁別する能力を表している．検索要求文はユーザにより自由に入力できるのが通例であるからその中の検索語に関する統計情報は前もって得られないのが普通である．よって，通常は検索要求文中の検索語について重みを計算することはできず，データベース中の語についてのみ重みを計算する．一方，本システムでは，両マニュアル中の全ての語について重みを計算することが出来るため，対応箇所を見つける際の精度の向上が期待される． Nobuyuki Ohmori 1997年10月08日(水) 1

keyesberry 2007/02/09

言語

リンク

パターン認識とは

keyesberry 2007/02/09

言語

リンク

http://www.forest.dnj.ynu.ac.jp/Forest/ja/term-extraction.html

keyesberry 2007/02/09

言語

リンク

専門用語（キーワード）自動抽出用Perlモジュール "TermExtract"の解説

はじめに　テキストデータから、専門用語を取り出すためのPerlモジュール"TermExtract"を解説します。日本語の文章中から単語を切り出す定番のソフトとして、「茶筅」や「案山子」がありますが、そのまま専門用語の抽出に使うには次の２つの問題があります。ひとつは、複合語に対応していないことです。専門用語の多くは単語を組み合わせて、複雑な概念を表すことが多くなります。特に「茶筅」の場合は単語を品詞単位で細かく分割するため、そのまま使うには難があります。もうひとつは、どの用語が重要であるか判断する仕組みを持たないことです。その問題点を解決したソフトに東京大学・中川裕志教授、横浜国立大学・森辰則助教授が作成した「専門用語自動抽出システム」があります。それは、１）「茶筅」の形態素解析結果を複合語に組み立て、２）その複合語（単語の場合もある）を重要度の高い順に返すものです。

keyesberry 2007/02/09

言語

リンク

形態素解析 - Wikipedia

形態素解析（けいたいそかいせき、（英: morphological analysis）は自然言語の文字列を意味に基づく最小単位へ分割しその品詞を特定する処理である[1]。形態素解析とは、対象言語の文法や単語の品詞等の情報[注 1]にもとづき、文法的な情報の注記の無い自然言語のテキストデータ（文）を単語の列に分割し、各単語の品詞や活用などを判別することで形態素（おおまかにいえば、言語で意味を持つ最小単位）の列を得る作業である[1]。自然言語処理の分野における主要なテーマのひとつであり、機械翻訳やかな漢字変換など応用も多い（もちろん、かな漢字変換の場合は入力が通常の文と異なり全てひらがなであり、その先に続く文章もその時点では存在しないなどの理由で、内容は機械翻訳の場合とは異なったものになる）。もっぱら言語学的な観点を主として言語学で研究されている文法にもとづく解析もあれば、コンピュータ上

keyesberry 2007/02/09

言語

リンク

形態素解析・構文解析入門

back 注意: このページの内容には、おそらく多くの間違いがあります。リンクされているので残しておきますが、利用には注意してください。(2008年3月、新山) 目次背景知識形態素解析とは構文解析とは練習問題言語処理関係の論文によく出てくる重要語 1. 背景知識まず「形態素」、「構文」などといった用語は、ほとんどが現在の科学的な「言語学」という分野に帰するものであることを最初に知っておく必要がある。体系だった言語学は、おもにチョムスキー言語学の創始とともに始まった。チョムスキーは 1960年代に、世界じゅうの数多くの言語には、実はそのすべてに共通する「普遍文法 (universal grammer)」がある、と言った。またチョムスキーはそのような文法を数学的な人工言語で厳密に表現する方法をも開発した。彼によれば、言語にはその理想化されたかたち (言語が言い間違

keyesberry 2007/02/09

言語

リンク

はてなブックマーク

タグ

関連タグで絞り込む (0)

言語に関するkeyesberryのブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2025年8月第2週）

今週のはてなブックマーク数ランキング（2025年8月第1週）

月間はてなブックマーク数ランキング（2025年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス