タグ

corpusに関するhayato34のブックマーク (2)

  • Public Morphologically Tagged Corpus

    形態素解析済みコーパスの公開 形態素解析済みのコーパスを公開します。 コーパスは、ウェブでフリーで公開されているテキストに対し、自動的に形態素解析を行い、その情報を付与したものです。 データのフォーマットは国立国語研究所で公開している全文検索システム『ひまわり』に準拠しています。 利用者の皆様は、データをダウンロードし、『ひまわり』をパソコンにインストールすれば、 単語単位での例文検索 基形での例文検索 品詞による検索結果の絞り込み といった作業を簡単に行うことができます。 動作環境 データを利用するのに必要な環境は以下の通りです。 パソコン Windows, Linux, Mac OS X などのパソコンでデータをお使いになれます。 下記の『ひまわり』が動作する環境のパソコンであれば大丈夫です。 全文検索システム『ひまわり』 国立国語研究所の『ひまわり』のサイトからプログラ

    hayato34
    hayato34 2010/06/25
    形態素解析済みコーパスの公開
  • Create and search a text corpus | Sketch Engine

    Sketch Engine is the ultimate tool to explore how language works. Its algorithms analyze authentic texts of billions of words (text corpora) to identify instantly what is typical in language and what is rare, unusual or emerging usage. It is also designed for text analysis or text mining applications. Sketch Engine is used by linguists, lexicographers, translators, students and teachers. It is a f

    Create and search a text corpus | Sketch Engine
  • 1