タグ

perlに関するkappa4のブックマーク (2)

  • 404 Blog Not Found:The Pursuit of Happiness

    2005年05月12日15:20 カテゴリ書評/画評/品評Lightweight Languages The Pursuit of Happiness - 書評 - Programming Perl あの塩野七生は、「ガリア戦記」に対してこう脱帽している。 Programming Perl (原著) 日語vol1. | 日語vol2. 『ガリア戦記』は、前置きも導入部も何もなく、いきなり次の一句からはじまる。 「ガリアは、そのすべてをふくめて、三つに分れる...」 これで、たいていの物書きは,歴史家でも研究者でも作家でも、マイッタという気持にさせられる。 [ローマ人の物語IV「ユリウス・カエサル ルビコン以前」] 私は,これと同じ衝撃を、Perl,いや現在コンピュータ言語を扱うものであればおよそ知らぬものがいないあの「ラクダ」の序章を見た時に受けた。 Preface The Purs

    404 Blog Not Found:The Pursuit of Happiness
  • 専門用語(キーワード)自動抽出用Perlモジュール "TermExtract"の解説

    はじめに  テキストデータから、専門用語を取り出すためのPerlモジュール"TermExtract"を解 説します。 日語の文章中から単語を切り出す定番のソフトとして、「茶筅」や「案山子」があ りますが、そのまま専門用語の抽出に使うには次の2つの問題があります。 ひとつは、複合語に対応していないことです。専門用語の多くは単語を組み合わせて、 複雑な概念を表すことが多くなります。特に「茶筅」の場合は単語を品詞単位で細かく 分割するため、そのまま使うには難があります。 もうひとつは、どの用語が重要であるか判断する仕組みを持たないことです。 その問題点を解決したソフトに東京大学・中川裕志教授、横浜国立大学・ 森辰則助教授が作成した「専門用語自動抽出システム」があります。 それは、1)「茶筅」の形態素解析結果を複合語に組み立て、2)その複合語(単語の場 合もある)を重要度の高い順に返すものです。

  • 1