タグ

dictionaryに関するuk-arのブックマーク (7)

  • 全文検索システム『ひまわり』 - 総合

    2008-08-01 UniDic/近代文語UniDic 言語データベースとソフトウェア 2008-07-10 全文検索システム『ひまわり』/『分類語彙表』サンプル MenuBar 2008-04-23 新着情報の履歴 2008-03-28 UniDic 2007-12-28 『たんぽぽ』,『プリズム』/『たんぽぽタガー』 2007-12-22 全文検索システム『ひまわり』/国文学研究資料館文データベースのデータを利用する方法 全文検索システム『ひまわり』/画像を含んだ資料の作成方法(簡単な漫画を例に) 全文検索システム『ひまわり』 言語データベースとソフトウェア 『ひまわり』とは 『ひまわり』は,言語研究用に設計された全文検索システムで,次の機能を持っています。 XML 文書から特定の文字列を高速に全文検索する機能 (Unicode に対応) 検索結果の KWIC (KeyWord I

  • コーパス紹介 - コーパス日本語学のための情報館

    はじめに 現在、日国内で比較的に低コストで入手可能なコーパス・言語資源の概要と入手方法を紹介します。 主に現代語の研究を想定したものです. 書き言葉 青空文庫 内容:ネット上の電子図書館青空文庫』の公開作品を一枚に収録しています。 入手方法1:「蔵書○○○○」という形で毎年更新版を500円で販売しています。現在は完売に購入はできないようです。 入手方法2:『インターネット図書館 青空文庫』を購入するとDVD-ROM(青空文庫4843作品ほか収録)が付いてきます。 関連文章:夷石寿賀子, 千葉 庄寿, 陳君慧 (2006)「『青空文庫』を言語コーパスとして使おう―メタデータ構築による歴史的・社会言語学的研究への応用の試み―」(言語処理学会第12回年次大会 (NLP2006) 発表論文集 pp.915-918) 茶漉による青空文庫の検索: 日語用例・コロケーション抽出システム『茶漉』によ

    コーパス紹介 - コーパス日本語学のための情報館
  • ウィクショナリー - Wikipedia

    ウィクショナリー (Wiktionary) は、コピーレフトなライセンス・オープンコンテントの辞書兼シソーラス(類語辞典)を作成し、配布することを目的としたウィキメディア財団によるプロジェクトである。GNU Free Documentation License (GFDL) およびクリエイティブ・コモンズ 表示 - 継承 3.0 非移植 (CC BY-SA 3.0) のデュアルライセンスで公開される。2002年12月12日[3]に活動を開始した。 「ウィクショナリー」はウィキ (Wiki) と辞書を意味するディクショナリー (dictionary) からの合成語である。ウィキペディアと同じくウィキ (MediaWiki)を使用しており、誰でも編集することが可能である。またインターウィキリンクとよばれるウィキ文法による簡便な記法を用いて、ウィキペディアを始めとするウィキメディアプロジェクト

  • コーパス日本語学のための情報館

    サイト移転しました。 http://jhlee.sakura.ne.jp/ から御覧ください。 お知らせ サイト移転しました。 http://jhlee.sakura.ne.jp/ から御覧ください。

    コーパス日本語学のための情報館
  • 豚辞書ワークショップ(TOP)

    クロスワード用語データ集『豚辞書』と派生データ&プログラムの作者{ぶたさん}によるサポート&ダウン・スポットです。全部フリーウェアとして提供されてます。いらっしゃいませ。当所の主の{ぶたさん}です。 ここでは日語のクロスワードやナンクロの用語データ集『豚辞書』と派生データや関連プログラムの製作集積を行い、フリーウェアとして公開をしております。 文字オンリーで{お楽しみ}はございません。ガッカリしてください。 概説は[豚データについて]で、 開発日誌や関連ドキュメント等は[書物類]で、 データやプログラム・ツ−ルの入手は[Download]で。 web上でクロスワードやナンクロの用語検索の出来るサイトへのリンクページを改造。[web上豚辞書字引]

  • 日本語 WordNet (wn-ja)

    語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日語をつけています。もちろん、 Princeton WordNetにはない日語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、

  • IDEA * IDEA

    ドットインストール代表のライフハックブログ

    IDEA * IDEA
  • 1