タグ

形態素解析に関するnihohiのブックマーク (5)

  • 形態素解析ツール– 英語と TreeTagger

    形態素解析ツール – 英語と TreeTagger を中心に – 田中省作∗ 1 はじめに コンピュータで自然言語を処理する研究 (自然言語処理: 以後, 言語処理と書きます) も歴史 を重ね,現在, 仮名漢字変換などを代表に, その成果が様々な場面で使用されています. 実際, 後述する形態素解析, 統語解析のレベルであれば, 実用的なツールが公開され, 場合によっては フリーで使用することができるようになってきました. そこで, 稿では, 言語処理の最も基礎 的な要素技術である形態素解析についてお話し, その具体的なツールとして TreeTagger を紹介 します. 2 形態素解析の概略 節では, 形態素解析の言語処理における位置づけを簡単に説明します. 既に形態素解析を 知っている方, ツールに興味がある方は, 節を読み飛ばしても構いません. 言語処理における一般

  • GENIA tagger home page

    GENIA Tagger - part-of-speech tagging, shallow parsing, and named entity recognition for biomedical text - What's New 20 Oct. 2006 A demo page is available. 6 Oct. 2006 Version 3.0: The tagger now performs named entity recognition. Overview The GENIA tagger analyzes English sentences and outputs the base forms, part-of-speech tags, chunk tags, and named entity tags. The tagger is specifically tune

  • 2009-06-02

    の生命科学データベース政策 - ライフサイエンス統合データベースプロジェクトのコンテンツ追加をやってました。 総合科学技術会議−ライフサイエンスPT(第14回)というのがあり、これの内容を盛り込んだのですが、DBCLSの今後だけでなく、日の国としてライフサイエンスをどうとらえているかの過去/現在/未来みたいなのがまとめられていて、このあたりに興味のある人に教えたくなるような回だったかと思います。その中での自分の立ち位置みたいなのも、ちと考えるところです。 id:syou6162が、出現頻度と連接頻度に基づく専門用語抽出 - yasuhisa's blogなんて刺激的なことをやっていて、TermExtractなんてのを紹介してくれたので、興味津々です。自分の方は、英語の文章も相手にしているので、英語でも使えそうなのがよいです。テキストマイニングは独学だからなー。しかも、ここは日だから

    2009-06-02
  • GENIA Taggerで英語の形態素解析 | インサイドフラッギング

    大量の英文を形態素解析することになった。日語ならMeCabを使ったことがあるのだけど、英語形態素解析器についてはまったく知らないので調べてみた。ちなみに、形態素解析器は英語でPOS(Part of Speech) Taggerというらしい。Part of Speechは品詞のこと。 英語形態素解析器がたくさんあるのはすぐわかったのだけど、自分が必要としているのは以下の2点。 各単語の原型(基形)が取得できるもの 大量の英文を処理する必要があるため高速なもの。CまたはC++で書かれているものが望ましい。 最初は簡単に見つかると思っていたのだけど、意外にも原型(基形)を返さないものが多く、さらに速度も考慮に入れると残ったのはGENIA Taggerだけだった。 GENIA Taggerは生物医学の文章に最適化されていて、ProteinやDNA, RNAなどがNamed Entityタ

  • ツールの紹介

    LinuxまたはWindows上で動く自然言語処理のツールや,Web上で実際にすぐに試せるツールを紹介しています.実際に触ってみてくださいね. 紹介するツールは随時増やしていきます. Web上ですぐに試せるツール ここで紹介するツールはどれも,インストール作業不要でWeb上ですぐに試せるツールばかりです.気軽に試してみてください. Ajax IME, Sumibi.org 海外でインターネットカフェに行ったとき,メールを読むことはできても,日語を入力することができなくて困ったことはありませんか?こんなときは,どちらかのサイトを使ってみてください.Webの技術を利用することにより,仮名漢字変換のソフトが入っていなくても日語を入力できます. 専門用語(キーワード)自動抽出サービス「言選Web」 専門的な文書から専門用語をピックアップしてくれます.東京大学の中川裕志先生の開発

  • 1