2008-08-01 UniDic/近代文語UniDic 言語データベースとソフトウェア 2008-07-10 全文検索システム『ひまわり』/『分類語彙表』サンプル MenuBar 2008-04-23 新着情報の履歴 2008-03-28 UniDic 2007-12-28 『たんぽぽ』,『プリズム』/『たんぽぽタガー』 2007-12-22 全文検索システム『ひまわり』/国文学研究資料館本文データベースのデータを利用する方法 全文検索システム『ひまわり』/画像を含んだ資料の作成方法(簡単な漫画を例に) 全文検索システム『ひまわり』 言語データベースとソフトウェア 『ひまわり』とは 『ひまわり』は,言語研究用に設計された全文検索システムで,次の機能を持っています。 XML 文書から特定の文字列を高速に全文検索する機能 (Unicode に対応) 検索結果の KWIC (KeyWord I
はじめに 現在、日本国内で比較的に低コストで入手可能なコーパス・言語資源の概要と入手方法を紹介します。 主に現代語の研究を想定したものです. 書き言葉 青空文庫 内容:ネット上の電子図書館『青空文庫』の公開作品を一枚に収録しています。 入手方法1:「蔵書○○○○」という形で毎年更新版を500円で販売しています。現在は完売に購入はできないようです。 入手方法2:『インターネット図書館 青空文庫』を購入するとDVD-ROM(青空文庫4843作品ほか収録)が付いてきます。 関連文章:夷石寿賀子, 千葉 庄寿, 陳君慧 (2006)「『青空文庫』を言語コーパスとして使おう―メタデータ構築による歴史的・社会言語学的研究への応用の試み―」(言語処理学会第12回年次大会 (NLP2006) 発表論文集 pp.915-918) 茶漉による青空文庫の検索: 日本語用例・コロケーション抽出システム『茶漉』によ
日本語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English 本プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日本語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日本語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日本語をつけています。もちろん、 Princeton WordNetにはない日本語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く