タグ

自然言語処理に関するohsarumanのブックマーク (4)

  • 圧縮新聞

    圧縮新聞はその日の最新ニュースをマルコフ連鎖でまとめて圧縮したものです。 ざっと眺めるだけでその日起こった事件が何となくわかる可能性がありますが保証はしません。 リロードするたび文章は変わります。 Twitter版もできました。 インタビュー特集や、映画『虹色デイズ』に出演する佐野玲於・中川大志・高杉真宙・横浜流星の座談会なども掲載。 詳しい観測が必要だと皮肉った。 長期間にわたり血糖値がコントロールできない状態が続くと、毛細血管がダメージを受けます。やがて目(網膜)や腎臓の毛細血管に障害が起き、網膜症や腎臓病などの合併症を発症することが理想だ。

  • ブログなどの文体を意識した構文解析システム

    構 文 解 析 ブログなどの文体も扱えます これまでのブログや口コミサイトを扱うシステムでは、形態素解析で記事を単語に分解して、キーワードがあるかないかだけで評価していました。そのため精度が上げられず手詰まり状態の感がありました。 より高度な評価をするためには、構文解析システムを導入して係り受け関係(キーワードとその直接関係のある単語との組み合わせ)をキーにして評価するのが効果的です。このシステムでは、ブログなどで取り交わされるような会話的な文章から、係り受け関係とともに、文の意図(良しあし、疑問、否定、要望、希望、勧誘・・)が取り出せます。 ホームページから使ってみられます!! 〜構文解析試用サイト(係り受け)はこちら〜 〜構文解析試用サイト(木構造)はこちら〜 1.テキストをエクセルで扱えます。 「係り」と「受け」と「良しあし、意図」をセットにしてCSV形式で取り出しま

  • ”専門用語(キーワード)自動抽出システム”のページ

    1.専門用語(キーワード)自動抽出システムとは? 当サイトでは、専門用語(キーワード)自動抽出システムの基システムおよび応用システムを提供しています。 専門用語(キーワード)自動抽出システムとは、単なる文章の単語分割ではありません。一般に文章中では複数の単語の組み合わせで複雑な概念を表す場合が多く、文章の内容が専門的な事項に特化すればその傾向はさらに顕著なものとなるでしょう。したがって文章中からキーワードを抽出する場合、単語分割機能だけでは意味を成しません。そこで、このシステムでは、(1)形態素解析プログラムによる単語分割、(2)複合語の作成、(3)文章中における重要度の計算、という3つのステップを踏むことで、複合語により複雑な概念を表すことが多い専門用語をキーワードとして文章中から抽出することに成功しました。 自作の文章からキーワードを抽出したい! メタデータ作成のためにウェッブサイト

    ohsaruman
    ohsaruman 2006/11/24
    専門用語自動抽出モジュール
  • YappoLogs: Lingua::JA::Summarize::Extract - 日本語文章のサマリ抽出

    Lingua::JA::Summarize::Extract - 日語文章のサマリ抽出 なんとなくPlaggerドリブンで日語の文章の中から特徴的な文節を抽出するモジュールを書きました。 具体的にはGetSenというWebサービスをCPANモジュールで使いたかったという感じです。 CPANに上げてあります。 Lingua::JA::Summarize::Extract 簡単な使い方は use strict; use warnings; use utf8; use Lingua::JA::Summarize::Extract; my $extracter = Lingua::JA::Summarize::Extract-&gr;new; my $text = "日語の文章を沢山書きます"; my $result = $extracter-&gr;extract($text); my $

    ohsaruman
    ohsaruman 2006/11/24
    Lingua::JA::Summarize::Extract
  • 1